디스틸버트
BERT 모델을 지식 증류(Knowledge Distillation) 기법으로 경량화한 모델로, 원래 모델보다 크기는 작고 속도는 빠르면서도 성능은 유사하게 유지한다. RewardHackWatch에서 실시간 탐지를 위한 핵심 분류기로 사용된다.
"LLM 에이전트의 꼼수 잡는다" 보상 해킹 탐지 오픈소스 RewardHackWatch 공개