핵심 요약
RAG 파이프라인에서 LLM이 검색된 정보를 무시하고 근거 없는 답변을 생성하는 문제를 해결하기 위해 Dokis가 개발됐다. 이 도구는 리트리버와 LLM 응답 사이에 위치하여 실시간으로 출처의 정당성을 강제한다. 검색 전에는 허용된 도메인의 소스만 프롬프트에 포함되도록 필터링하고, 생성 후에는 답변을 문장 단위로 분해하여 원본 청크와의 일치 여부를 BM25 알고리즘으로 검증한다. LLM을 사용하지 않는 결정론적 방식을 채택하여 1ms 미만의 초저지연 성능을 제공하며, LangChain과 LlamaIndex 등 주요 프레임워크와의 통합을 지원한다.
배경
RAG(Retrieval-Augmented Generation) 파이프라인에 대한 기본 이해, Python 프로그래밍 및 LangChain/LlamaIndex 사용 경험, BM25 및 텍스트 유사도 측정 개념
대상 독자
프로덕션 환경에서 RAG 시스템의 신뢰성과 출처 투명성을 개선하고자 하는 AI 엔지니어
의미 / 영향
Dokis는 RAG 시스템의 신뢰성 검증을 오프라인 평가에서 실시간 런타임 강제로 전환하는 중요한 도구이다. 특히 LLM 비용과 지연 시간 증가 없이 결정론적인 출처 추적을 가능하게 함으로써, 기업용 AI 애플리케이션의 규제 준수와 품질 관리를 획기적으로 간소화할 수 있다.
섹션별 상세
import dokis
result = dokis.audit(query, chunks, response)
print(result.compliance_rate) # 0.91
print(result.passed) # True
print(result.provenance_map) # {"Aspirin inhibits...": "https://pubmed.com/1"}Dokis를 사용하여 쿼리, 청크, 응답 간의 출처 일치율과 맵을 확인하는 기본 코드

from dokis.adapters.langchain import ProvenanceRetriever
retriever = ProvenanceRetriever(
base_retriever=your_existing_retriever,
config=dokis.Config(allowed_domains=["pubmed.ncbi.nlm.nih.gov"]),
)
docs = retriever.invoke(query)LangChain 어댑터를 사용하여 특정 도메인만 허용하는 출처 검증 리트리버를 구현하는 예시

실무 Takeaway
- 의료나 법률 등 높은 신뢰성이 요구되는 RAG 서비스에서 Dokis의 도메인 허용 목록 기능을 사용해 검증된 소스만 답변 생성에 활용되도록 강제할 수 있다.
- LLM 기반 가드레일 대신 BM25 매칭 방식을 채택함으로써 API 비용을 절감하고 전체 시스템의 응답 지연 시간을 1ms 수준으로 유지하며 출처 검증이 가능하다.
- 답변의 각 문장과 소스 URL이 매핑된 구조화된 데이터를 로그로 저장하여 향후 시스템 성능 평가 및 사용자 신뢰도 향상을 위한 근거 자료로 활용할 수 있다.
언급된 리소스
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.