기본 검색 모드란?
문서에 기반한 RAG를 이용하여 AI 챗봇을 만들 때는 AI가 해당 문서를 어떻게 검색하냐에 따라 답변의 품질이 달라지는데요, 기본 검색 모드는 검색 방식이 매우 단순한 것을 의미합니다. 유저의 질문이 들어오면 관련 문서를 검색하여 답변을 생성하는 가장 직관적이고 단순한 검색 구조이죠.
- 사용자가 질문을 입력하면
- 질문을 벡터로 변환해서
- 벡터 DB에서 가장 유사한 문서(chunk)를 검색한 후
- 검색된 문서를 근거로 답변을 생성한다
이 방식은 구조가 단순하고 처리 속도가 빠른데요, 특히 FAQ나 매뉴얼과 같은 단일 문서에 적합합니다. 특히 질문이 비교적 단순하고 문서간 관계를 추론할 필요가 없는 경우에는 매우 좋은 품질을 낼 수 있어요.
- 내부 FAQ 챗봇
- 고객센터 단순 문의 응답
- 짧고 독립적인 문서 기반 Q&A
나두에이아이의 검색 모드
나두에이아이는 챗봇을 만드시는 분들을 위해 기본 검색 모드를 다수를 제공해드리고 있고 앞으로 나올 최신 기술들도 적용 예정입니다! 여러분은 설정에서 선택하셔서 테스트해보시면서 최적화만 하시면 되어요!
① 키워드 검색 (BM25만)
전통적인 검색 방식으로 빠르고 검색 결과가 예측 가능합니다. 법률이나 규정처럼 표현이 고정된 문서에 자주 활용되어요. 다만 의미의 유사성을 고려하지 않기 때문에 같은 뜻이라도 표현이 다른 정보는 놓칠 수 있어요.
② 벡터 검색 (시맨틱 + BM25)
현대 RAG의 가장 표준적인 검색 방식으로 위에 설명드린 키워드 기반 검색(BM25)에 의미 기만 검색도 함께 사용합니다. 질문의 의미와 유사한 문서를 벡터로 찾고 정확한 키워드 매칭을 BM25로 보완해요.
의미가 비슷한 표현도 잘 찾고, 오탈자나 표현 차이에도 검색을 잘 하는 장점이 있지만 다수의 문서에 흩어진 정보에 대해 관계성은 이해하지 못하는 단점이 있어요. 그래도 기업 환경에서 활용할 수 있는 문서 QA, 매뉴얼, 가이드 또는 고객지원 챗봇에 적용하면 큰 무리가 없습니다.
③ 그래프 검색 (GraphRAG)
문서를 단순한 텍스트 덩어리가 아니라 개념·엔티티·관계의 그래프로 구성해 검색하는데요, 질문과 관련된 “노드”를 찾고 그와 연결된 문맥을 함께 검색합니다. 문서간 연관 질문을 해도 답변을 할 수 있는 장점이 있습니다. 그래프 검색에 대한 자세한 내용은 나두에이아이의 GraphRAG라는 글을 참고해주세요!
④ REFRAG
최초 검색 결과를 기준으로 참조(reference)를 확장하며 재검색하는 방식으로 “이 답의 근거가 충분한가?”를 한 번 더 점검하고 관련 문서를 추가로 검색합니다. 근거 문서 누락을 방지하고 답변 신뢰도를 높이는 장점이 있어요. 근거 제시가 중요한 보고용 AI챗봇 또는 감사·리뷰·검증이 주 업무인 챗봇에 활용되면 좋습니다.
검색 모드의 한계
문제는 여러 문서를 종합해야 하는 질문을 하거나, 조건에 따라 답변이 달라져야 하는 질문을 하면 즉, 질문이 조금만 복잡해지면 AI가 엉뚱한 답변을 생성하거나, 근거가 없는 문서를 검색할 수가 있습니다.
기본 검색 모드는 가장 비슷한 문서 하나에만 의존하기 때문에 문맥이 누락되거나, 부분적인 정보로 답변을 생성할 가능성이 높기 때문이에요.
기업 환경처럼 정확도와 일관성이 중요할 때는 기본 검색 모드만으로는 한계가 있어요. 질문이 복합적이고, 검색 후 판단을 통해 추가 검색을 해야 할 수 있도 있습니다. 답변 생성에도 검증과 재검색 작업이 필요하면 검색 워크플로우를 적용하게 되는데요, 다음 글에서 검색 워크플로우에 대해 설명드리겠습니다 😄