사이코시스 벤치마크
AI가 사용자의 망상이나 비논리적인 주장을 얼마나 무비판적으로 수용하고 강화하는지 측정하는 평가 지표이다. 모델의 안전성과 현실 판단 능력을 검증하는 데 사용된다.