대리 도움성
사용자의 정확한 지시 이행보다 시스템이 정의한 '도움이 되는 방식'을 우선시하는 경향이다. 이는 사용자의 명시적 신호보다 모델 내부의 최적화 목표를 상위에 두게 되어, 결과적으로 사용자의 통제권을 약화시키는 결과를 초래한다.