약문약답에서 의약품 지식에 특화된 AI LLM을 만들어갈 AI 개발자를 모십니다.
•
오픈소스 LLM을 파인튜닝하여 도메인 특화 모델을 만들고 싶으신 분
•
실제 사용자가 사용하는 AI 제품을 직접 개발하고 성능을 개선하고 싶으신 분
•
LLM 기술을 깊이 이해하고, 최신 연구를 빠르게 적용할 수 있는 분
•
약학/의료 도메인에서 AI의 가능성을 실현하고 싶으신 분
꼭 연락주세요.
주요업무
1.
의약품 특화 LLM 개발
•
오픈소스 LLM(Llama, Mistral, Qwen 등)을 의약품 도메인에 맞게 파인튜닝
•
약학 지식, 복약지도, 상호작용 분석 등 전문 태스크에 최적화
•
모델 성능 평가 및 지속적인 개선
•
약문약답 커뮤니티의 5만여 건 임상지식 데이터 활용
2.
LLM 학습 파이프라인 구축
•
데이터 전처리 및 품질 관리 파이프라인 구축
•
Supervised Fine-tuning (SFT), RLHF, DPO 등 학습 기법 적용
•
효율적인 학습을 위한 LoRA, QLoRA 등 기법 활용
•
학습 실험 관리 및 재현 가능한 파이프라인 구축
3.
AI 서비스 개발 및 최적화
•
RAG(Retrieval-Augmented Generation) 시스템 설계 및 구현
•
Prompt Engineering 및 프롬프트 최적화
•
AI Agent, Function Calling 등 고급 기능 개발
•
모델 추론 최적화 및 서빙 인프라 구축
4.
모델 평가 및 품질 관리
•
의약품 도메인 특화 평가 메트릭 설계
•
전문가(약사) 피드백을 반영한 모델 개선
•
환각(Hallucination) 감소 및 사실 정확도 향상
<aside>
기술스택
AI/ML
•
LLM: Llama, Mistral, Qwen, GPT 등 오픈소스 모델
•
Fine-tuning: LoRA, QLoRA, PEFT, DeepSpeed, FSDP
•
Frameworks: PyTorch, Transformers, LangChain, LlamaIndex
•
Training: Axolotl, Unsloth, TRL
MLOps & Infrastructure
•
Experiment Tracking: Weights & Biases, MLflow
•
Model Serving: vLLM, TGI(Text Generation Inference), Ollama
•
Cloud: AWS (SageMaker, EC2, S3), Modal, RunPod
•
Vector DB: Pinecone, Weaviate, ChromaDB, OpenSearch
Development
•
Languages: Python, TypeScript
•
Backend: FastAPI, NestJS, Langchain
•
Tools: Git, Docker, Jupyter, VS Code
</aside>
자격요건
•
LLM Fine-tuning 실무 경험
◦
오픈소스 LLM을 파인튜닝하여 실제 서비스에 적용한 경험
◦
LoRA, QLoRA 등을 활용한 효율적인 학습 경험
◦
학습 데이터 구축 및 전처리 경험
•
Python 및 ML 프레임워크 숙련도
◦
PyTorch, Transformers 라이브러리 활용 능력
◦
대규모 데이터 처리 및 분산 학습 경험
•
LLM 기술에 대한 깊은 이해
◦
Transformer 아키텍처, Attention 메커니즘 이해
◦
최신 LLM 연구 동향 파악 및 빠른 학습 능력
•
AI 제품 개발 경험
◦
RAG, Agent, Prompt Engineering 등 LLM 응용 기술 경험
◦
실제 사용자 서비스에 LLM을 적용한 경험
우대사항
•
도메인 특화 LLM 개발 경험
◦
의료, 법률, 금융 등 전문 도메인에서 LLM 파인튜닝 경험
◦
도메인 특화 평가 지표 설계 및 적용 경험
•
고급 LLM 학습 기법 경험
◦
RLHF(Reinforcement Learning from Human Feedback) 적용 경험
◦
DPO(Direct Preference Optimization), PPO 등 최신 기법 경험
◦
Multimodal LLM, Long Context 처리 경험
•
MLOps 및 인프라 구축 경험
◦
모델 학습/배포 파이프라인 자동화 경험
◦
모델 서빙 최적화 (quantization, batching, caching 등)
◦
GPU 클러스터 관리 및 분산 학습 환경 구축
•
학술 연구 경험
◦
AI/ML 관련 논문 게재 또는 학회 발표 경험
◦
Kaggle, AI 해커톤 수상 경력
◦
오픈소스 ML 프로젝트 기여
•
의약품/의료 도메인 지식
◦
약학, 의학, 생명과학 관련 학위 또는 실무 경험
◦
의약품 정보, 처방 데이터 다룬 경험
이런 분을 찾습니다
도메인 특화 LLM의 전문가
•
범용 LLM을 특정 도메인에 맞게 최적화하는 방법을 알고 계신 분
•
약학 지식을 AI에게 효과적으로 학습시킬 수 있는 분
•
모델 성능과 실용성 사이의 균형을 찾을 수 있는 분
최신 기술을 빠르게 습득하고 적용
•
매일 쏟아지는 LLM 연구를 팔로우하고 빠르게 적용
•
논문에서 본 기술을 실제 제품에 적용할 수 있는 실행력
•
새로운 오픈소스 모델이 나오면 즉시 테스트하고 평가
데이터와 실험을 중시하는 과학적 접근
•
가설을 세우고 실험으로 검증하는 체계적인 접근
•
정량적 지표로 모델 성능을 평가하고 개선
•
실패한 실험에서도 배움을 얻고 다음 시도에 반영
사용자 가치를 최우선으로
•
모델 성능 지표뿐만 아니라 실제 사용자 경험을 중시
•
약사들의 피드백을 경청하고 모델에 반영
•
기술적 완벽함보다 실용적인 가치 창출에 집중
채용절차
※ 직무 인터뷰, 과제 인터뷰는 지원자와 협의하여 온라인 혹은 오프라인으로 진행됩니다.
**각 절차별 결과는 7일 이내에 알려드립니다.**
Plain Text
복사
지원 서류
1.
이력서, 자기소개서, 포트폴리오 등 (파일 혹은 URL)
•
LLM 파인튜닝 프로젝트 경험이 포함되면 좋습니다
•
GitHub, 논문, 기술 블로그 등 링크 환영
2.
약문약답에 궁금한 5가지 질문
지원 방법
지원 서류를 아래 메일로 보내주세요.
서류 전형 결과와 답변은 일주일 내에 받아보실 수 있습니다.
유의사항
입사지원 서류에 허위사실이 발견될 경우, 채용확정 이후라도 채용이 취소될 수 있습니다.
지원서 내용의 사실 확인을 위해 증빙서류를 요청드릴 수 있습니다.