로짓 수준 지도
단순히 정답 텍스트만 맞추는 것이 아니라, 모델이 출력하는 각 토큰별 확률 분포(Logit) 자체를 타겟 모델과 일치시키도록 학습하는 방식이다. 텍스트 기반 학습보다 훨씬 더 풍부하고 세밀한 정보를 전달할 수 있다.