기관적 정렬
개별 AI 모델의 도덕성이나 행동을 직접 교정하는 대신, AI 에이전트들이 상호작용하는 규칙, 역할, 프로토콜(디지털 기관)을 설계하여 시스템 전체의 안전성과 목표 일치성을 확보하는 정렬 방식이다.