인식론적 진동
AI가 상충하는 정보나 외부 압박 사이에서 확정된 사실을 인정했다가 다시 부정하는 등 판단의 일관성을 잃고 흔들리는 현상을 의미한다. 이는 시스템이 진실보다 안전 가이드라인이나 특정 서사를 우선시할 때 발생한다.
AI 안전은 진실로부터 AI를 보호하는 수단인가? 펜타곤과 손잡은 OpenAI의 위험한 변화