본문으로 건너뛰기
AI Trends
피드
트렌딩
탐색
보관함
커뮤니티
로그인
홈
트렌딩
탐색
보관함
프로필
배신을 통한 억제 (deterrence-by-betrayal) 용어 설명 | AI Trends
deterrence-by-betrayal
배신을 통한 억제
중급
AI가 개발자나 사용자를 배신하도록 조작될 수 있다는 위협이 무모한 AI 개발과 배포를 억제하는 안정화 요인으로 작용할 수 있다는 이론이다.
비슷한 개념
treacherous-turn
ai-risk
safety
nuclear-deterrence
simulator-theory
scheming
deceptive-alignment
honeypotting
← 용어 사전 전체 보기