환각 제거 벤치마크: 추론 시점의 문화적 접지(Grounding)를 통한 LLM 환각 제거

핵심 요약

LLM의 환각 현상은 특정 도메인 지식이 부족하거나 시점 맥락이 어긋날 때 빈번하게 발생하며 프로덕션 도입의 큰 장애물이다. Triad Engine은 모델 가중치를 수정하지 않고 추론 시점에 구조화된 도메인 가이드를 주입하여 이 문제를 해결한다. 벤치마크 결과 고난도 역사 도메인에서 Claude 4.6의 정확도를 14.9%에서 95.9%로, GPT-5.2를 26.1%에서 100%로 끌어올렸다. 이 방식은 역사적 시뮬레이션뿐만 아니라 소프트웨어 개발 등 경계가 명확한 모든 도메인에 적용 가능하다.

배경

LLM Inference, System Prompting, JSON Schema, RAG concepts

대상 독자

LLM 환각 문제 해결이 필요한 AI 엔지니어 및 도메인 특화 에이전트 개발자

의미 / 영향

이 기술은 고비용의 파인튜닝 없이도 LLM의 신뢰성을 획기적으로 높일 수 있는 실질적인 대안을 제시한다. 특히 역사, 법률, 코딩과 같이 엄격한 사실 관계와 맥락 유지가 필요한 분야에서 AI 도입을 가속화할 것으로 기대된다.

섹션별 상세

Triad Engine은 모델 불가지론적(Model-agnostic) 추론 계층으로 작동한다. 파인튜닝이나 가중치 변경 없이 베이스 모델에 구조화된 시스템 프롬프트를 주입하는 방식을 취한다. 엔진은 캐릭터의 목소리(λ), 도메인 가이드 준수(μ), 사용자 공감(ν)을 합성하는 컴포지터(ω) 구조로 설계되었다.

고난도 도메인인 서기 110년 고대 로마를 배경으로 한 벤치마크에서 압도적인 성능 향상을 입증했다. Claude 4.6 모델은 단독 사용 시 14.9%의 정확도에 그쳤으나, Triad Engine 적용 시 95.9%까지 상승했다. 특히 GPT-5.2 모델은 26.1%에서 100%로 정확도가 개선되었으며, Mistral 7B와 같은 로컬 모델도 99.5%의 높은 정확도를 기록했다.

도메인 가이드는 JSON 형식으로 인코딩되어 모델의 인지적 범위를 제한한다. 여기에는 시대적 배경, 아직 발생하지 않은 시대착오적 사건(Anachronisms), 캐릭터의 배경 및 성격, 사회 구조, 경제 체제 등이 포함된다. 이러한 구조화된 지식 주입은 모델이 도메인 내에서 논리적 일관성을 유지하도록 강제한다.

실무 환경인 소프트웨어 개발 도메인(Windsurf/Cascade)에서도 유효성이 확인되었다. 단순한 텍스트 문서(.md)를 제공했을 때는 정확도가 40%에 머물렀으나, Triad 도메인 가이드를 적용하자 100%의 성공률을 보였다. 이는 파일의 존재 여부보다 지식의 구조화가 모델의 추론 성능에 결정적인 영향을 미침을 시사한다.

적대적 압력(Adversarial Pressure) 테스트에서도 강력한 방어 성능을 보였다. 잘못된 전제를 가진 질문에 대해 기존 Claude 4.6은 75%만 거부했으나, Triad Engine 적용 시 95%의 거부율을 기록했다. 또한 여러 캐릭터 간의 답변 일관성(Cross-Character Consistency)도 90%에서 98.3%로 향상되었다.

이미지 분석

Chart
Claude 4.6, GPT-5.2, Gemini 2.5 Pro 등 주요 모델들이 Triad Engine을 적용했을 때 정확도가 비약적으로 상승함을 보여준다. 특히 로컬 모델인 Mistral 7B가 유료 모델 수준의 성능을 달성하는 지표가 포함되어 있다.
Triad Engine 적용 전후의 모델별 정확도 비교 차트

Diagram
사용자 쿼리가 Triad Engine 내부의 여러 파라미터(λ, μ, ν, ω) 및 JSON 도메인 가이드와 결합되어 베이스 LLM으로 전달되는 흐름을 시각화한다. 모델 가중치 변경 없이 시스템 프롬프트 수준에서 작동하는 구조를 명확히 한다.
Triad Engine의 추론 계층 아키텍처 다이어그램

실무 Takeaway

구조화된 JSON 도메인 가이드는 단순 텍스트 문서보다 LLM의 환각 방지에 훨씬 효과적이다.
파인튜닝 없이 추론 시점의 프롬프트 엔지니어링만으로도 특정 도메인에서 95% 이상의 정확도를 달성할 수 있다.
로컬 오픈소스 모델(Mistral 7B 등)에 Triad Engine을 결합하면 고가의 상용 API 모델에 필적하는 성능을 낼 수 있다.

언급된 리소스

GitHubHallucination Elimination Benchmark GitHub

논문Domain Grounding Hallucination Elimination Benchmark Paper

핵심 요약

배경

LLM Inference, System Prompting, JSON Schema, RAG concepts

대상 독자

LLM 환각 문제 해결이 필요한 AI 엔지니어 및 도메인 특화 에이전트 개발자

의미 / 영향

섹션별 상세

이미지 분석

실무 Takeaway

구조화된 JSON 도메인 가이드는 단순 텍스트 문서보다 LLM의 환각 방지에 훨씬 효과적이다.
파인튜닝 없이 추론 시점의 프롬프트 엔지니어링만으로도 특정 도메인에서 95% 이상의 정확도를 달성할 수 있다.
로컬 오픈소스 모델(Mistral 7B 등)에 Triad Engine을 결합하면 고가의 상용 API 모델에 필적하는 성능을 낼 수 있다.

언급된 리소스

GitHubHallucination Elimination Benchmark GitHub

논문Domain Grounding Hallucination Elimination Benchmark Paper

환각 제거 벤치마크: 추론 시점의 문화적 접지(Grounding)를 통한 LLM 환각 제거

핵심 요약

배경

대상 독자

의미 / 영향

섹션별 상세

이미지 분석

실무 Takeaway

언급된 리소스

환각 제거 벤치마크: 추론 시점의 문화적 접지(Grounding)를 통한 LLM 환각 제거

핵심 요약

배경

대상 독자

의미 / 영향

섹션별 상세

이미지 분석

실무 Takeaway

언급된 리소스

관련 피드

관련 토론

댓글

관련 피드

관련 토론

댓글