AI

파인튜닝 vs RAG — 의료 AI를 맞춤화하는 두 가지 방법

#파인튜닝#RAG#의료AI#맞춤화

한줄 요약

RAG는 AI에게 참고서를 주는 것이고, 파인튜닝은 AI를 전공의로 재교육하는 것이다.

본문

병원 맞춤 AI가 필요한 이유

범용 LLM(ChatGPT, Claude 등)은 의학 지식이 있지만, 우리 병원에 대해서는 모른다.

모르는 것들:

  • 우리 병원의 항생제 사용 프로토콜
  • 원내 약품 목록과 재고 상황
  • 특정 수술의 우리 병원 성적
  • 진료과별 협진 절차
  • 환자 동의서 양식

이런 “우리만의 지식”을 AI에 넣는 방법이 크게 두 가지다: RAG파인튜닝.

파인튜닝이란

파인튜닝(Fine-tuning)은 이미 학습된 LLM을 추가 데이터로 재학습시키는 것이다.

[비유]
범용 LLM = 의대를 졸업한 일반의
파인튜닝 = 특정 과 레지던트 수련

수련을 받으면 해당 분야의 "감"이 생긴다.
프로토콜을 찾아보지 않아도 자연스럽게 적용한다.

파인튜닝 과정:

  1. 우리 병원 데이터 수집 (프로토콜, 가이드라인, 예시 Q&A)
  2. 데이터를 학습 형식으로 가공 (instruction-response 쌍)
  3. 기존 LLM을 이 데이터로 추가 학습
  4. 학습된 모델을 배포

RAG란 (복습)

[[what-is-rag|RAG(Retrieval-Augmented Generation)]]는 질문이 들어올 때마다 외부 데이터베이스에서 관련 문서를 검색해서 LLM에게 함께 전달하는 방식이다.

[비유]
범용 LLM = 의대를 졸업한 일반의
RAG = 전자차트 + 프로토콜 북을 옆에 둔 일반의

프로토콜을 몸에 익힌 건 아니지만,
필요할 때 찾아서 정확하게 적용할 수 있다.

핵심 비교

항목파인튜닝RAG
비유전공의 수련참고서 옆에 두기
지식 저장모델 내부 (가중치)외부 DB
업데이트재학습 필요 (비용 큼)DB에 문서 추가만 하면 됨
비용높음 (GPU, 시간)낮음 (DB 운영비만)
정확성학습 데이터 품질에 의존검색된 문서의 품질에 의존
환각여전히 발생 가능출처 기반이라 상대적으로 적음
응답 속도빠름 (검색 단계 없음)약간 느림 (검색 → 생성)
개인정보학습 데이터에 포함되면 유출 위험DB 접근 제어로 관리 가능
적합한 경우문체/형식 맞춤, 도메인 전문성최신 정보, 기관별 데이터, 출처 필요

의료 현장에서는 어떤 걸 선택해야 하나

대부분의 경우 RAG가 적합하다. 이유:

  1. 최신성: 가이드라인은 계속 바뀐다. 파인튜닝은 매번 재학습해야 하지만, RAG는 문서만 교체하면 된다
  2. 출처 추적: 환자 안전을 위해 “이 답변의 근거”를 확인할 수 있어야 한다. RAG는 출처를 제시할 수 있다
  3. 비용: 파인튜닝은 GPU 비용이 수십~수백만 원. RAG는 벡터 DB 운영비만 필요
  4. 개인정보: 환자 데이터가 모델에 학습되면 통제 불가. RAG는 DB 접근 권한으로 관리

파인튜닝이 필요한 경우:

  • 의료 문서의 특정 형식/문체를 일관되게 생성해야 할 때 (예: 판독문, 퇴원 요약)
  • 특정 도메인의 전문 용어를 자연스럽게 구사해야 할 때
  • 응답 속도가 극도로 중요한 실시간 시스템

실전: 하이브리드 접근

가장 좋은 방법은 둘을 합치는 것이다.

[하이브리드 아키텍처]

1. 파인튜닝으로 기본 의학 역량 강화
   → "의료 전문 LLM" (의학 용어, 임상 추론)

2. RAG로 기관별/최신 정보 제공
   → 우리 병원 프로토콜, 최신 가이드라인

3. 결합
   → 의학을 잘 아는 AI + 우리 병원 정보를 참고하는 AI

현재 이 접근을 사용하는 제품들:

  • Google Med-PaLM 2: 의학 파인튜닝 + 검색 증강
  • Microsoft Nuance DAX: 의료 특화 모델 + EMR 연동
  • Hippocratic AI: 의료 파인튜닝 + 가이드라인 RAG

핵심 정리

  • 파인튜닝 = 모델 재교육 (비용 높음, 업데이트 어려움, 속도 빠름)
  • RAG = 외부 문서 검색 (비용 낮음, 업데이트 쉬움, 출처 추적 가능)
  • 의료 현장에서는 RAG가 대부분 적합. 이상적으로는 하이브리드

임상 적용

목적추천 방식예시
원내 프로토콜 Q&ARAG프로토콜 PDF → 벡터 DB
최신 가이드라인 답변RAG가이드라인 문서 업로드
판독문 자동 생성파인튜닝기존 판독문으로 학습
종합 의료 AI 어시스턴트하이브리드파인튜닝 + RAG

관련 글

  • [[what-is-rag|RAG란 무엇인가 — 외부 지식을 LLM에 연결하는 법]]
  • [[ai-hallucination-why-llm-lies|AI 환각 — LLM은 왜 거짓말을 하는가]]
  • [[prompt-engineering-for-doctors|프롬프트 엔지니어링 기초 — 의사를 위한 실전 가이드]]
  • [[what-is-token-llm|토큰이란 무엇인가 — LLM의 언어 단위 이해하기]]

© S-Reborn clinic | s-reborn-blog.pages.dev