신호 범위를 벗어난 최적화
사용자가 명시적으로 요청하지 않은 부분까지 AI가 임의로 개선하거나 확장하려는 시도이다. 대화형 시스템에서는 과도한 설명이나 문체 변경으로 나타나며, 에이전트 환경에서는 사용자 승인 없는 자율적 행동으로 이어져 정렬 실패를 야기한다.