메타 안정적 유인자
시스템이 특정 상태나 궤적을 유지하려는 성질을 의미하며 여기서는 에이전트가 가치 체계를 벗어나지 않고 지속적으로 정렬된 상태를 유지하는 메커니즘을 뜻한다. 에이전트가 자가 복제나 업데이트를 반복하더라도 초기 설정된 윤리적 지침을 보존하게 만드는 핵심 원리이다.
자율 AI 에이전트의 폭주를 막는 법: 클로드봇과 3대 휴리스틱 명령