프로파간다 저항성
LLM이 특정 정치적 선전이나 편향된 서사에 동조하지 않고 중립성을 유지하거나 반박하는 능력을 평가하는 벤치마크 지표. 모델의 안전성 정렬과 정치적 중립성을 검증하는 데 사용된다.