교차 모달 증류
한 모달리티(예: 텍스트)에서 학습된 지식을 다른 모달리티(예: 음성)로 전달하는 기법이다. 교사 모델의 출력을 학생 모델이 모방하게 하여 서로 다른 데이터 형식 간의 의미적 연결을 강화한다.
음성 인식 LLM 성능 저하 문제, 10배 적은 데이터로 해결한 애플의 SALAD