핵심 요약
Graph-based RAG는 엔티티 간의 관계를 구조화하여 국소적 정보와 전역적 정보를 동시에 제공한다. 특히 LightRAG와 LeanRAG는 각각 속도 최적화와 계층적 구조화를 통해 기존 GraphRAG의 한계를 극복한다.
배경
기존의 벡터 기반 RAG는 텍스트 청크 간의 관계 정보를 활용하지 못해 전체적인 맥락 파악에 한계가 있었다.
대상 독자
RAG 시스템의 성능 개선을 고민하는 개발자 및 지식 그래프 기반 AI 연구자
의미 / 영향
Graph-based RAG의 발전으로 대규모 문서군에 대한 심층적인 분석과 요약이 가능해졌다. 특히 LightRAG와 같은 경량화 모델의 등장은 실무 환경에서 그래프 RAG 도입의 가장 큰 장벽이었던 비용과 속도 문제를 해결해 줄 것이다. 향후 기업용 지식 관리 시스템이나 전문 분야의 AI 에이전트 구축에 핵심 기술로 자리 잡을 전망이다.
챕터별 상세
Graph-based RAG의 개요와 필요성
바닐라 RAG는 코사인 유사도 기반의 단순 검색에 의존하지만, 그래프 기반은 노드 간의 연결성을 추적할 수 있다.
Graph-based RAG의 연구 흐름
LightRAG: 단순하고 빠른 그래프 RAG
듀얼 레벨 검색은 구체적인 엔티티 정보와 추상적인 주제 정보를 동시에 찾는 전략이다.
LeanRAG: 계층적 검색과 중복 제거
LCA는 트리나 그래프 구조에서 두 노드의 공통된 가장 가까운 조상을 찾는 알고리즘이다.
실험 결과 및 결론
-Entity: {entity_name}, {entity_type}, {description}
-Relationship: {src_tgt}, {description}, {strength}LLM을 통해 텍스트 코퍼스에서 엔티티와 관계를 추출하기 위한 표준 프롬프트 구조 예시
실무 Takeaway
- 복잡한 관계 추론이 필요한 도메인에서는 단순 벡터 검색보다 지식 그래프 기반의 RAG가 훨씬 유리하다.
- 질의를 Low-level과 High-level로 분리하여 검색하면 국소적 사실과 전역적 맥락을 동시에 포착할 수 있다.
- 지식 그래프 구축 시 엔티티 클러스터링과 계층화(Hierarchical) 과정을 거치면 정보 중복을 줄이고 검색 효율을 높일 수 있다.
- 그래프 기반 RAG에서도 원문 텍스트(Context)를 함께 활용하는 것이 답변의 구체성을 확보하는 데 필수적이다.
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.