세속적 AI 안전
현재의 딥러닝 기술 연장선상에서 AI 안전 문제를 해결하려는 접근 방식이다. 근본적인 패러다임 전환보다는 기존 모델의 정렬 및 통제 기법을 고도화하여 위험을 관리하는 데 집중한다.
AI가 스스로를 정렬한다? 위험 관리의 핵심 'AI 위임' 전략