계층적 검색
문서 전체의 맥락을 파악하는 상위 수준 검색과 구체적인 텍스트 조각을 찾는 하위 수준 검색을 결합한 구조이다. LLM에 전달되는 컨텍스트의 노이즈를 줄이고 토큰 효율성을 극대화한다.
RAG의 고질병, 속도와 정확도 사이의 고민을 해결하는 3가지 핵심 전략