중립성
AI가 민감하거나 논쟁적인 주제에 대해 특정 입장에 치우치지 않고 균형 잡힌 정보를 제공하는 성질이다. 사용자가 스스로 판단을 내릴 수 있도록 돕는 것을 목표로 하며, Anthropic은 학습 및 테스트 단계에서 이를 강화하기 위한 기법을 적용한다.