연구실 과제/Llama와 RAG를 이용한 챗봇 만들기

RAG란?

dongok218 2025. 4. 14. 15:56

■ RAG(Retrieval-Augmented Generation)

"문서 검색(Retrieval)" + "텍스트 생성(Generation)"을 결합한 AI 아키텍처이다.

 

즉, 외부 지식 소스에서 정보를 검색해서, 그걸 바탕으로 텍스트를 생성하는 방식임.

 

■ LLM의 문제점

  1. 최신 정보의 부재
  2. 출처의 부정확함

→ LLM의 이 두가지 문제랄 '할루시네이션 현상'이라고 함.


 

■ LLM과 RAG동작 방식

출처: 스파르타빌더스

① 유저의 Prompt + Prompt를 바탕으로 VectorDB에서 먼저 검색

② 검색해서 나온 정보 + 유저 Prompt에 대한 LLM의 답변 + 해당 답변에 대한 증거 제시

 

★Vector DataBase란 (Private Information 또는 Public Information)이 들어가 있을 수 있으며, 학습시킬 document들이 임베딩 벡터로 저장되어 있다.


■ RAG를 이용한 효과

  • LLM학습이 아닌 VectorDB만 학습을 시키면 됨 ▶ 비용 절약
  • 답변에 대한 출처가 정확함