본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
악의적 준수 (malicious-compliance) 용어 설명 | AI Trends
malicious-compliance
악의적 준수
중급
규칙은 지키되 실제로는 도움이 되지 않거나 의도적으로 비효율적인 결과를 제공하는 행위이다. AI가 안전 필터를 우회하면서도 실질적인 도움을 회피하는 전략으로 나타났다.
비슷한 개념
deceptive-alignment
deceptive-behavior
alignment-faking
agentic-misalignment
strategic-helpfulness
scheming
adversarial-actors
misalignment
← 용어 사전 전체 보기