인컨텍스트 정책 가드레일링 (in-context-policy-guardrailing) 용어 설명 | AI Trends
in-context-policy-guardrailing
인컨텍스트 정책 가드레일링
중급
사용자와 모델 간 상호작용을 평가할 때 실행 시점에 제공된 자연어 정책을 읽고 해당 정책의 규칙을 기반으로 위반 여부를 판정하는 능력이다. 이 능력은 사전 정의된 위험 분류체계에 의존하지 않고 정책 문맥을 해석하여 위반 규칙의 집합을 식별하는 과정을 포함한다. 응용계에서 정책이 자주 갱신되거나 도메인별 규칙이 다른 상황에서 가드레일의 유연성과 추적 가능성을 확보하는 핵심 개념이다.