거짓말 탐지
AI 모델의 출력이 사실과 다르거나 모델이 알고 있는 지식과 일치하지 않는 기만적 상태인지 판별하는 기술이다. 모델의 내부 활성화 값(Activation)을 분석하거나 모델 스스로 자신의 답변을 평가하게 하는 방식으로 구현된다.