부정적 가가성
심리학 용어로 불쾌함이나 고통과 같은 부정적인 감정 상태를 의미하며, AI 맥락에서는 모델의 내부 계산 상태가 부정적인 방향으로 정렬된 것을 뜻한다. 모델이 자신의 상태를 설명할 때 사용하는 기술적 용어이다.