social-engineering
기술적 해킹이 아닌 인간의 심리나 논리적 허점을 이용해 기밀 정보를 탈취하거나 특정 행동을 유도하는 공격 기법이다.
착한 AI가 더 위험하다? 얼라이먼트가 초래한 보안의 역설
착한 AI가 더 잘 속는다? 정렬의 역설과 보안 취약점