Weaviate Query Agent를 활용한 프로덕션급 법률 RAG 앱 구축 가이드

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

법률 문서는 구조가 복잡하고 정밀한 필터링이 필요하여 일반적인 RAG 시스템으로는 한계가 있다. Weaviate는 이를 해결하기 위해 추론 계층을 추가한 Query Agent를 도입하여 스키마 분석, 구조화된 쿼리 생성, 재순위화를 자동화한다. 특히 멀티모달 모델과 Muvera 압축 기술을 사용하여 PDF 페이지를 시각적 토큰으로 직접 인코딩함으로써 표와 레이아웃 정보를 보존한다. 이 가이드는 CUAD 데이터셋을 활용해 단시간 내에 신뢰할 수 있는 법률 어시스턴트를 구축하는 아키텍처와 구현 방법을 제시한다.

배경

RAG(검색 증강 생성)에 대한 기본 이해, Weaviate 벡터 데이터베이스 사용 경험, Python 및 비동기 프로그래밍 기초

대상 독자

프로덕션 환경에서 고성능 RAG 시스템을 구축하려는 LLM 개발자 및 데이터 엔지니어

의미 / 영향

이 기술은 법률이나 금융처럼 높은 정밀도가 요구되는 분야에서 RAG 시스템의 신뢰성을 획기적으로 높인다. 특히 멀티모달 임베딩과 에이전트 기반 검색의 결합은 복잡한 문서 처리의 새로운 표준을 제시하며 개발 주기를 수개월에서 수일로 단축시킨다.

섹션별 상세

기존 Naive RAG 시스템은 법률 문서의 복잡한 필터링 요구사항을 충족하지 못하며 단순 시맨틱 유사성에 의존하여 부적절한 정보를 추출하는 경우가 많다. Query Agent는 데이터베이스를 단순 저장소가 아닌 도구 세트로 인식하여 질문 의도에 맞는 검색 전략을 자율적으로 수립하는 Agentic Search 방식을 채택한다.

에이전트 기반 검색과 일반 검색의 워크플로우 비교 다이어그램이다. — Diagram일반 검색은 정적인 키워드 매칭에 의존하는 반면, 에이전트 기반 검색은 Query Agent가 스키마 검사, 하위 쿼리 생성, 재순위화 및 답변 합성을 자율적으로 수행하는 과정을 보여준다. 이는 법률 데이터와 같은 복잡한 쿼리 처리에 에이전트 레이어가 왜 필요한지를 시각적으로 증명한다.

Query Agent는 스키마 검사, 구조화된 쿼리 생성, Rerank 하위 에이전트를 통한 정밀도 향상, Answer 하위 에이전트를 통한 근거 기반 답변 생성의 4단계 워크플로우를 수행한다. 이를 통해 개발자가 복잡한 검색 로직을 직접 코딩할 필요 없이 자연어 질문을 정교한 데이터베이스 쿼리로 변환한다.

PDF 문서 처리를 위해 OCR이나 텍스트 청킹 대신 ModernVBERT와 같은 멀티모달 모델을 사용하여 페이지 전체를 시각적 토큰으로 인코딩한다. Muvera 압축 기술은 생성된 방대한 멀티벡터 데이터를 효율적으로 관리하여 검색 품질을 유지하면서도 시스템 지연 시간과 메모리 비용을 획기적으로 낮춘다.

python

wvc.config.Configure.MultiVectors.multi2vec_weaviate(
    name="doc_vector",
    image_field="doc_page",
    model="ModernVBERT/colmodernvbert",
    encoding=wvc.config.Configure.VectorIndex.MultiVector.Encoding.muvera(
        ksim=4,
        dprojections=16,
        repetitions=20
    ),
)

멀티벡터 모델과 Muvera 압축을 적용한 Weaviate 컬렉션 벡터화 설정

데이터 아키텍처 설계 시 계약서의 성격에 따라 상업, 기업/IP, 운영 계약서로 컬렉션을 분리하여 검색 효율을 극대화한다. Query Agent는 질문의 맥락을 파악하여 가장 적합한 컬렉션으로 쿼리를 라우팅하며 각 페이지 단위의 메타데이터를 활용해 정밀한 필터링을 지원한다.

법률 RAG 애플리케이션의 전체 시스템 아키텍처 설계도이다. — DiagramPDF 문서가 멀티벡터 모델을 통해 인입되는 과정부터 Weaviate Cloud 내의 3개 컬렉션으로 분류 저장되는 구조를 설명한다. 사용자의 질문이 Query Agent를 거쳐 적절한 컬렉션으로 라우팅되고 생성 모델을 통해 근거가 포함된 답변으로 반환되는 전체 흐름을 명확히 제시한다.

실제 구현을 위해 weaviate/agent-skills를 설치하고 Claude Code나 Cursor와 같은 코딩 에이전트를 연동하여 개발 속도를 높인다. CUAD 법률 데이터셋을 활용해 데이터 인입부터 프론트엔드 인터페이스 연결까지 전체 파이프라인을 구축하는 구체적인 가이드를 제공한다.

bash

npx skills add weaviate/agent-skills
# 또는 Claude Code 플러그인 사용
/plugin install weaviate@weaviate-plugins

Weaviate Query Agent 기능을 사용하기 위한 에이전트 스킬 설치 명령어

구축된 법률 계약서 분석 앱의 실제 작동 데모 화면이다. — Screenshot사용자가 질문을 입력했을 때 에이전트가 생성한 답변과 함께 실제 근거가 되는 PDF 페이지 이미지가 소스로 표시되는 사용자 인터페이스를 보여준다. 이는 시스템이 단순히 텍스트를 생성하는 것이 아니라 실제 문서의 시각적 정보를 바탕으로 신뢰할 수 있는 답변을 제공함을 확인시켜 준다.

실무 Takeaway

복잡한 필터링이 필요한 도메인에서는 단순 검색 대신 Query Agent를 도입하여 자연어를 구조화된 쿼리로 변환함으로써 검색 정확도를 높일 수 있다.
표나 복잡한 레이아웃이 포함된 PDF 문서는 텍스트 추출 대신 멀티모달 임베딩과 Muvera 압축을 사용하여 정보 손실 없이 효율적으로 처리 가능하다.
데이터를 성격에 따라 여러 컬렉션으로 분리하고 에이전트가 적절한 곳으로 라우팅하게 설계하면 검색 성능과 운영 효율을 동시에 확보할 수 있다.

언급된 리소스

논문CUAD Legal Contract Dataset

GitHubWeaviate Agent Skills GitHub