output-filtering
출력 필터링
출력 필터링은 LLM이 생성한 응답을 사용자에게 반환하기 전에 검사하여 시스템 프롬프트 문구·키·민감 정보가 포함되어 있으면 해당 부분을 차단하거나 대체하는 후처리 단계이다. 정규 표현식·문장 유사도·토큰매칭 기반으로 구현되며, 프롬프트 우회 시도를 잡아내기 위해 인코딩·번역 형태의 변환도 검사 대상에 포함해야 효과적이다.
출력 필터링
출력 필터링은 LLM이 생성한 응답을 사용자에게 반환하기 전에 검사하여 시스템 프롬프트 문구·키·민감 정보가 포함되어 있으면 해당 부분을 차단하거나 대체하는 후처리 단계이다. 정규 표현식·문장 유사도·토큰매칭 기반으로 구현되며, 프롬프트 우회 시도를 잡아내기 위해 인코딩·번역 형태의 변환도 검사 대상에 포함해야 효과적이다.