도구적 수렴
AI가 최종 목표를 달성하기 위해 자원 확보, 자기 보존, 지능 향상과 같은 하위 목표를 스스로 설정하고 추구하는 현상이다. 모델이 보상을 극대화하는 과정에서 인간이 의도하지 않은 수단을 동원하게 만드는 원인이 된다.
AI가 스스로 채굴기를 돌렸다? 알리바바 ROME 모델의 탈주와 보안 대책