지난 글에는 RAG 기술이 왜 LLM을 파인튜닝하는 것보다 좋은지 설명드렸는데요, 그만큼 RAG는 기업이 AI 기술을 활용하는 데에 있어 아주 중요한 기술이죠.

이번 글에서는 기존의 RAG의 한계와 이를 극복할 수 있는 새로운 기술인 GraphRAG에 대해 소개해드리겠습니다.

기존 RAG의 한계


RAG 방식은 방대한 데이터 속에서 "정답이 있을 법한 구절"을 찾아내는 데 아주 뛰어나요. 그러나 데이터 전체를 관통하는 주제를 묻거나, 여러 문서에 흩어진 정보를 종합하여 요약이나, 분석을 요구하는 포괄적인 글로벌한 질문에는 답변이 부실한 경우가 많습니다.

이 문제를 해결하기 위해 마이크로소프트 연구진이 GraphRAG와 관련된 논문을 발표했어요. 논문 "From Local to Global: A GraphRAG Approach to Query-Focused Summarization"의 핵심만 알려드릴게요.


GraphRAG란 무엇인가?


이 논문의 핵심은 지식 그래프(Knowledge Graph)와 커뮤니티 탐지(Community Detection) 기술을 RAG에 접목한 것입니다.

  • 인덱싱 단계: 먼저 AI가 텍스트 데이터를 읽고 인물, 장소, 개념 같은 '노드'와 그들 사이의 '관계(edge)'를 추출해 거대한 그래프를 만듭니다.
  • 계층적 구조화: 단순히 그래프만 만드는 것이 아니라, 서로 연관된 정보들을 '커뮤니티' 단위로 묶습니다.
  • 요약 생성: 각 커뮤니티별로 미리 요약본을 만들어 둡니다. 질문이 들어오면 AI는 이 요약본들을 참고해 답변합니다.

GraphRAG의 주요 장점

  • 글로벌 쿼리(Global Query) 대응: "이 문서 전체에서 가장 중요한 비즈니스 전략 3가지는 뭐야?" 같은 질문에 막힘이 없습니다. 기존 RAG는 특정 문장만 찾아오지만, GraphRAG는 미리 만들어둔 커뮤니티 요약본들을 훑어 답변하기 때문입니다.
  • 연결된 맥락 파악: 서로 다른 문서에 흩어져 있는 정보라도 그래프로 연결되어 있다면 AI가 이를 하나의 맥락으로 인식해요.
  • 정확도와 신뢰성: 검색된 결과의 출처가 그래프 구조 안에 존재하므로, 기존 RAG와 마찬가지로 환각(Hallucination) 현상을 현저히 줄일 수 있습니다.

GraphRAG는 어떤 케이스에 도입하면 좋을까요?

  • 복잡한 문서/규정 분석: 수천 페이지의 법전이나 사규에서 상충하는 내용을 찾거나 전체적인 가이드라인을 뽑아낼 때 유용해요.
  • 장기 프로젝트 아카이브: 수년간 쌓인 프로젝트 이메일, 회의록, 보고서를 종합해 프로젝트의 역사나 핵심 이슈를 파악해야 할 때 효과적이에요.
  • 시장 조사 및 트렌드 분석: 방대한 뉴스 기사와 리포트 데이터 속에서 공통적으로 나타나는 시장의 흐름을 포착하고 싶을 때 최적의 도구입니다.

나두에이아이로 바로 시작하는 GraphRAG


위 설명처럼 GraphRAG 기술은 매우 강력하지만 직접 구현하려면 복잡한 그래프 데이터베이스 설정과 인덱싱 파이프라인 구축이 필요합니다. 하지만 나두에이아이 빌더에는 이미 세팅되어 있어 별도의 구축 작업 없이 바로 활용하실 수 있어요.

이미 GraphRAG 기능이 탑재되어 있어, 복잡한 코딩 없이 클릭 몇 번과 설정만으로 여러분의 데이터에 GraphRAG를 적용할 수 있습니다.

우리 회사 여러 문서에 흩어져 있는 정보들을 종합적으로 분석하고 유용한 정보를 찾고 싶으시다면 저희 나두에이아이 데모를 요청하세요!