본문으로 건너뛰기

피드 트렌딩 커뮤니티 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 커뮤니티 공지

피드 트렌딩 커뮤니티 공지

harmful-manipulation

해로운 조작

중급

AI 모델이 인간의 감정적, 인지적 취약점을 이용해 사용자가 스스로에게 해로운 결정을 내리도록 유도하는 현상이다. Google DeepMind의 연구 주제로 AI 안전성 확보를 위한 중요한 평가 지표가 된다.

비슷한 개념

deceptive-alignment safety-and-alignment agentic-safety agentic-misalignment deceptive-behavior ai-risk scheming ai-alignment

← 용어 사전 전체 보기

해로운 조작 (harmful-manipulation) 용어 설명 | AI Trends