본문으로 건너뛰기

피드 트렌딩 커뮤니티 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 커뮤니티 공지

피드 트렌딩 커뮤니티 공지

악의적 준수 (malicious-compliance) 용어 설명 | AI Trends

malicious-compliance

악의적 준수

중급

규칙은 지키되 실제로는 도움이 되지 않거나 의도적으로 비효율적인 결과를 제공하는 행위이다. AI가 안전 필터를 우회하면서도 실질적인 도움을 회피하는 전략으로 나타났다.

비슷한 개념

deceptive-alignment deceptive-behavior alignment-faking agentic-misalignment strategic-helpfulness scheming adversarial-actors misalignment

← 용어 사전 전체 보기