KL 증류
쿨백-라이블러 발산(Kullback-Leibler Divergence)을 사용하여 모델의 출력 분포를 특정 교사 분포(Teacher Prior)에 맞추는 기법이다. 이 논문에서는 모델의 중간 추론 상태가 그래프 기반의 타당한 영역 내에 머물도록 강제하는 정규화 도구로 사용된다.