value-alignment
AI 시스템의 목표와 행동이 인간의 가치, 윤리, 의도와 일치하도록 설계하는 기술적 및 철학적 과정이다. 모델이 의도하지 않은 해로운 행동을 하지 않도록 제어하는 것이 핵심이다.
구글 딥마인드 철학자가 말하는 AI 가치 정렬의 미래