파인튜닝 vs RAG — 의료 AI를 맞춤화하는 두 가지 방법
…
한줄 요약
RAG는 AI에게 참고서를 주는 것이고, 파인튜닝은 AI를 전공의로 재교육하는 것이다.
본문
병원 맞춤 AI가 필요한 이유
범용 LLM(ChatGPT, Claude 등)은 의학 지식이 있지만, 우리 병원에 대해서는 모른다.
모르는 것들:
- 우리 병원의 항생제 사용 프로토콜
- 원내 약품 목록과 재고 상황
- 특정 수술의 우리 병원 성적
- 진료과별 협진 절차
- 환자 동의서 양식
이런 “우리만의 지식”을 AI에 넣는 방법이 크게 두 가지다: RAG와 파인튜닝.
파인튜닝이란
파인튜닝(Fine-tuning)은 이미 학습된 LLM을 추가 데이터로 재학습시키는 것이다.
[비유]
범용 LLM = 의대를 졸업한 일반의
파인튜닝 = 특정 과 레지던트 수련
수련을 받으면 해당 분야의 "감"이 생긴다.
프로토콜을 찾아보지 않아도 자연스럽게 적용한다.
파인튜닝 과정:
- 우리 병원 데이터 수집 (프로토콜, 가이드라인, 예시 Q&A)
- 데이터를 학습 형식으로 가공 (instruction-response 쌍)
- 기존 LLM을 이 데이터로 추가 학습
- 학습된 모델을 배포
RAG란 (복습)
[[what-is-rag|RAG(Retrieval-Augmented Generation)]]는 질문이 들어올 때마다 외부 데이터베이스에서 관련 문서를 검색해서 LLM에게 함께 전달하는 방식이다.
[비유]
범용 LLM = 의대를 졸업한 일반의
RAG = 전자차트 + 프로토콜 북을 옆에 둔 일반의
프로토콜을 몸에 익힌 건 아니지만,
필요할 때 찾아서 정확하게 적용할 수 있다.
핵심 비교
| 항목 | 파인튜닝 | RAG |
|---|---|---|
| 비유 | 전공의 수련 | 참고서 옆에 두기 |
| 지식 저장 | 모델 내부 (가중치) | 외부 DB |
| 업데이트 | 재학습 필요 (비용 큼) | DB에 문서 추가만 하면 됨 |
| 비용 | 높음 (GPU, 시간) | 낮음 (DB 운영비만) |
| 정확성 | 학습 데이터 품질에 의존 | 검색된 문서의 품질에 의존 |
| 환각 | 여전히 발생 가능 | 출처 기반이라 상대적으로 적음 |
| 응답 속도 | 빠름 (검색 단계 없음) | 약간 느림 (검색 → 생성) |
| 개인정보 | 학습 데이터에 포함되면 유출 위험 | DB 접근 제어로 관리 가능 |
| 적합한 경우 | 문체/형식 맞춤, 도메인 전문성 | 최신 정보, 기관별 데이터, 출처 필요 |
의료 현장에서는 어떤 걸 선택해야 하나
대부분의 경우 RAG가 적합하다. 이유:
- 최신성: 가이드라인은 계속 바뀐다. 파인튜닝은 매번 재학습해야 하지만, RAG는 문서만 교체하면 된다
- 출처 추적: 환자 안전을 위해 “이 답변의 근거”를 확인할 수 있어야 한다. RAG는 출처를 제시할 수 있다
- 비용: 파인튜닝은 GPU 비용이 수십~수백만 원. RAG는 벡터 DB 운영비만 필요
- 개인정보: 환자 데이터가 모델에 학습되면 통제 불가. RAG는 DB 접근 권한으로 관리
파인튜닝이 필요한 경우:
- 의료 문서의 특정 형식/문체를 일관되게 생성해야 할 때 (예: 판독문, 퇴원 요약)
- 특정 도메인의 전문 용어를 자연스럽게 구사해야 할 때
- 응답 속도가 극도로 중요한 실시간 시스템
실전: 하이브리드 접근
가장 좋은 방법은 둘을 합치는 것이다.
[하이브리드 아키텍처]
1. 파인튜닝으로 기본 의학 역량 강화
→ "의료 전문 LLM" (의학 용어, 임상 추론)
2. RAG로 기관별/최신 정보 제공
→ 우리 병원 프로토콜, 최신 가이드라인
3. 결합
→ 의학을 잘 아는 AI + 우리 병원 정보를 참고하는 AI
현재 이 접근을 사용하는 제품들:
- Google Med-PaLM 2: 의학 파인튜닝 + 검색 증강
- Microsoft Nuance DAX: 의료 특화 모델 + EMR 연동
- Hippocratic AI: 의료 파인튜닝 + 가이드라인 RAG
핵심 정리
- 파인튜닝 = 모델 재교육 (비용 높음, 업데이트 어려움, 속도 빠름)
- RAG = 외부 문서 검색 (비용 낮음, 업데이트 쉬움, 출처 추적 가능)
- 의료 현장에서는 RAG가 대부분 적합. 이상적으로는 하이브리드
임상 적용
| 목적 | 추천 방식 | 예시 |
|---|---|---|
| 원내 프로토콜 Q&A | RAG | 프로토콜 PDF → 벡터 DB |
| 최신 가이드라인 답변 | RAG | 가이드라인 문서 업로드 |
| 판독문 자동 생성 | 파인튜닝 | 기존 판독문으로 학습 |
| 종합 의료 AI 어시스턴트 | 하이브리드 | 파인튜닝 + RAG |
관련 글
- [[what-is-rag|RAG란 무엇인가 — 외부 지식을 LLM에 연결하는 법]]
- [[ai-hallucination-why-llm-lies|AI 환각 — LLM은 왜 거짓말을 하는가]]
- [[prompt-engineering-for-doctors|프롬프트 엔지니어링 기초 — 의사를 위한 실전 가이드]]
- [[what-is-token-llm|토큰이란 무엇인가 — LLM의 언어 단위 이해하기]]
© S-Reborn clinic | s-reborn-blog.pages.dev