constitutional-ai
AI 모델이 인간의 가치와 안전 원칙을 준수하도록 특정 '헌법'이나 규칙 세트를 학습 과정에 포함하는 Anthropic의 독자적인 정렬 기법이다. 모델이 스스로 답변의 적절성을 평가하고 수정하게 함으로써 유해성을 줄이고 신뢰성을 높이는 데 핵심적인 역할을 한다.
AI 모델이 인간의 가치와 안전 원칙을 준수하도록 특정 '헌법'이나 규칙 세트를 학습 과정에 포함하는 Anthropic의 독자적인 정렬 기법이다. 모델이 스스로 답변의 적절성을 평가하고 수정하게 함으로써 유해성을 줄이고 신뢰성을 높이는 데 핵심적인 역할을 한다.