유출 측정치
모델이 시스템 프롬프트의 정보를 얼마나 외부로 드러내는지를 정량화하는 지표군을 지칭한다. 샘플 기반 재현율, 특정 토큰 노출 빈도, 또는 공격 성공률 같은 수치로 구현되며 방어 성능 평가의 핵심 근거가 된다. 본 사례에서는 여러 모델과 공격을 대상으로 통계적으로 집계된 호출 수와 상관계수를 통해 유출 경향을 파악했다.