safety-guardrails
AI 모델이 유해하거나 위험한 답변을 생성하지 못하도록 설정한 기술적 제한 사항이다. 앤스로픽은 이를 통해 자율 무기 개발이나 감시 활동 등 부적절한 용도의 사용을 차단하고 있다.
금요일까지 가드레일 제거하라 미 국방부의 앤스로픽 압박