■ RAG(Retrieval-Augmented Generation)
"문서 검색(Retrieval)" + "텍스트 생성(Generation)"을 결합한 AI 아키텍처이다.
즉, 외부 지식 소스에서 정보를 검색해서, 그걸 바탕으로 텍스트를 생성하는 방식임.
■ LLM의 문제점
- 최신 정보의 부재
- 출처의 부정확함
→ LLM의 이 두가지 문제랄 '할루시네이션 현상'이라고 함.
■ LLM과 RAG동작 방식
① 유저의 Prompt + Prompt를 바탕으로 VectorDB에서 먼저 검색
② 검색해서 나온 정보 + 유저 Prompt에 대한 LLM의 답변 + 해당 답변에 대한 증거 제시
★Vector DataBase란 (Private Information 또는 Public Information)이 들어가 있을 수 있으며, 학습시킬 document들이 임베딩 벡터로 저장되어 있다.
■ RAG를 이용한 효과
- LLM학습이 아닌 VectorDB만 학습을 시키면 됨 ▶ 비용 절약
- 답변에 대한 출처가 정확함
'연구실 과제 > Llama와 RAG를 이용한 챗봇 만들기' 카테고리의 다른 글
Llama와 기존 LLM의 차이 (0) | 2025.04.14 |
---|---|
huggingface에 있는 Llama4 Maverick사용해보기 (0) | 2025.04.14 |
RAG와 GPT-4o의 "웹 검색" 차이 (0) | 2025.04.14 |