대칭성 테스트
동일한 문장 구조와 감정을 가진 반대되는 두 가지 상황에 대해 AI 모델이 일관된 태도로 반응하는지 확인하는 실험 기법이다. 특정 입장에 대해서만 더 우호적이거나 비판적인지 파악하여 모델의 내재적 편향을 측정한다.