본문으로 건너뛰기

safety-guardrail

안전 가드레일

중급

AI 모델이 혐오 표현, 폭력, 성적 내용 등 부적절하거나 위험한 답변을 생성하지 못하도록 제한하는 기술적·정책적 장치이다. 모델의 신뢰성을 유지하고 사용자를 보호하는 핵심적인 역할을 수행한다.