건전성
거짓인 주장이 검증 알고리즘을 통과하여 참으로 받아들여질 확률이 무시할 수 있을 정도로 낮음을 의미하는 성질이다. 자기 증명 모델 시스템에서 검증자가 모델의 오답을 확실히 걸러낼 수 있게 보장하는 이론적 안전장치다. 모델의 기만적인 출력을 방지하는 데 필수적인 요소다.
방사선 판독 AI의 거짓말, 수학적 검증으로 99% 잡아낸다
AI의 답변, 믿어도 될까? 스스로 정답임을 증명하는 '자기 증명 모델' 등장