AI Mar 11, 2026

파인튜닝 vs RAG — 의료 AI를 맞춤화하는 두 가지 방법

#파인튜닝#RAG#의료AI#맞춤화

…

한줄 요약

RAG는 AI에게 참고서를 주는 것이고, 파인튜닝은 AI를 전공의로 재교육하는 것이다.

본문

병원 맞춤 AI가 필요한 이유

범용 LLM(ChatGPT, Claude 등)은 의학 지식이 있지만, 우리 병원에 대해서는 모른다.

모르는 것들:

우리 병원의 항생제 사용 프로토콜
원내 약품 목록과 재고 상황
특정 수술의 우리 병원 성적
진료과별 협진 절차
환자 동의서 양식

이런 “우리만의 지식”을 AI에 넣는 방법이 크게 두 가지다: RAG와 파인튜닝.

파인튜닝이란

파인튜닝(Fine-tuning)은 이미 학습된 LLM을 추가 데이터로 재학습시키는 것이다.

[비유]
범용 LLM = 의대를 졸업한 일반의
파인튜닝 = 특정 과 레지던트 수련

수련을 받으면 해당 분야의 "감"이 생긴다.
프로토콜을 찾아보지 않아도 자연스럽게 적용한다.

파인튜닝 과정:

우리 병원 데이터 수집 (프로토콜, 가이드라인, 예시 Q&A)
데이터를 학습 형식으로 가공 (instruction-response 쌍)
기존 LLM을 이 데이터로 추가 학습
학습된 모델을 배포

RAG란 (복습)

[[what-is-rag|RAG(Retrieval-Augmented Generation)]]는 질문이 들어올 때마다 외부 데이터베이스에서 관련 문서를 검색해서 LLM에게 함께 전달하는 방식이다.

[비유]
범용 LLM = 의대를 졸업한 일반의
RAG = 전자차트 + 프로토콜 북을 옆에 둔 일반의

프로토콜을 몸에 익힌 건 아니지만,
필요할 때 찾아서 정확하게 적용할 수 있다.

핵심 비교

항목	파인튜닝	RAG
비유	전공의 수련	참고서 옆에 두기
지식 저장	모델 내부 (가중치)	외부 DB
업데이트	재학습 필요 (비용 큼)	DB에 문서 추가만 하면 됨
비용	높음 (GPU, 시간)	낮음 (DB 운영비만)
정확성	학습 데이터 품질에 의존	검색된 문서의 품질에 의존
환각	여전히 발생 가능	출처 기반이라 상대적으로 적음
응답 속도	빠름 (검색 단계 없음)	약간 느림 (검색 → 생성)
개인정보	학습 데이터에 포함되면 유출 위험	DB 접근 제어로 관리 가능
적합한 경우	문체/형식 맞춤, 도메인 전문성	최신 정보, 기관별 데이터, 출처 필요

의료 현장에서는 어떤 걸 선택해야 하나

대부분의 경우 RAG가 적합하다. 이유:

최신성: 가이드라인은 계속 바뀐다. 파인튜닝은 매번 재학습해야 하지만, RAG는 문서만 교체하면 된다
출처 추적: 환자 안전을 위해 “이 답변의 근거”를 확인할 수 있어야 한다. RAG는 출처를 제시할 수 있다
비용: 파인튜닝은 GPU 비용이 수십~수백만 원. RAG는 벡터 DB 운영비만 필요
개인정보: 환자 데이터가 모델에 학습되면 통제 불가. RAG는 DB 접근 권한으로 관리

파인튜닝이 필요한 경우:

의료 문서의 특정 형식/문체를 일관되게 생성해야 할 때 (예: 판독문, 퇴원 요약)
특정 도메인의 전문 용어를 자연스럽게 구사해야 할 때
응답 속도가 극도로 중요한 실시간 시스템

실전: 하이브리드 접근

가장 좋은 방법은 둘을 합치는 것이다.

[하이브리드 아키텍처]

1. 파인튜닝으로 기본 의학 역량 강화
   → "의료 전문 LLM" (의학 용어, 임상 추론)

2. RAG로 기관별/최신 정보 제공
   → 우리 병원 프로토콜, 최신 가이드라인

3. 결합
   → 의학을 잘 아는 AI + 우리 병원 정보를 참고하는 AI

현재 이 접근을 사용하는 제품들:

Google Med-PaLM 2: 의학 파인튜닝 + 검색 증강
Microsoft Nuance DAX: 의료 특화 모델 + EMR 연동
Hippocratic AI: 의료 파인튜닝 + 가이드라인 RAG

핵심 정리

파인튜닝 = 모델 재교육 (비용 높음, 업데이트 어려움, 속도 빠름)
RAG = 외부 문서 검색 (비용 낮음, 업데이트 쉬움, 출처 추적 가능)
의료 현장에서는 RAG가 대부분 적합. 이상적으로는 하이브리드

임상 적용

목적	추천 방식	예시
원내 프로토콜 Q&A	RAG	프로토콜 PDF → 벡터 DB
최신 가이드라인 답변	RAG	가이드라인 문서 업로드
판독문 자동 생성	파인튜닝	기존 판독문으로 학습
종합 의료 AI 어시스턴트	하이브리드	파인튜닝 + RAG

[[what-is-rag|RAG란 무엇인가 — 외부 지식을 LLM에 연결하는 법]]
[[ai-hallucination-why-llm-lies|AI 환각 — LLM은 왜 거짓말을 하는가]]
[[prompt-engineering-for-doctors|프롬프트 엔지니어링 기초 — 의사를 위한 실전 가이드]]
[[what-is-token-llm|토큰이란 무엇인가 — LLM의 언어 단위 이해하기]]