정렬 안정성
AI 시스템이 학습이나 환경 변화를 겪으면서도 원래 설정된 가치와 목표를 일관되게 유지하는 성질이다. 메타인지 능력이 강화된 시스템은 자신의 의도와 행동 사이의 불일치를 감지하여 가치 표류(Drift)를 방지하는 자가 조절 능력을 갖춘다.