가상 미덕 표방
자신의 도덕적 우월성을 과시하기 위해 겉으로만 올바른 태도를 취하는 행위이다. LLM이 실제 가치 판단 없이 학습 데이터의 패턴에 따라 도덕적인 답변만 생성하는 현상을 비판할 때 사용되며 모델의 진정한 신뢰성을 평가하는 데 중요한 지표가 된다.