KV 캐시 제약 조건 주입
RLHF와 같은 사후 학습 대신 생성 전 KV 캐시에 직접 제약 조건을 주입하는 기법이다. 이를 통해 모델이 물리적으로 제약 조건을 위반하는 것을 에너지 소모가 큰 상태로 만들어, 프롬프트 엔지니어링을 통한 탈옥을 원천적으로 차단한다.