노출 알파
교사에게 공개되는 privileged reasoning의 양을 조절하는 연속 변수 α를 가리키며, 0은 final answer만, 1은 전체 privileged reasoning을 나타낸다. 학습 중에 조정되며 teacher–student KD의 커뮤니케이션 강도를 조절한다.