본문으로 건너뛰기

safeguards

안전 장치

입문

AI 모델이 유해하거나 위험한 정보를 생성하지 못하도록 설정한 기술적 가드레일이다. Anthropic은 국방용 오용을 막기 위한 엄격한 안전 정책을 고수하고 있으나, 이것이 미 정부와의 갈등을 초래하는 원인이 되기도 했다.