학생-교사 로그 비율
각 토큰에 대해 student가 예측한 접두사 조건부 확률의 로그에서 teacher 확률의 로그를 뺀 값이다. 이 값이 클수록 학생이 선호하되 교사가 거부하는 선택으로 판단되어 '핵심 잘못된 토큰' 탐지 신호로 사용된다.