AI 정렬
AI 시스템의 목표와 행동을 인간의 가치 및 의도와 일치시키는 연구 분야다. AI가 예기치 못한 방식으로 행동하여 인간에게 해를 끼치지 않도록 보장하는 것이 핵심이다.
단순 지시로 성능 66.7% 향상, AI의 숨겨진 지능을 여는 열쇠
AI에게 목표가 꼭 필요할까? 인간의 '실천'에서 찾는 새로운 정렬 방법
AI에게 월급을 주면 인류 멸망을 막을 수 있다? AI 재산권 논쟁