상호 정보량
두 확률 변수 사이의 상호 의존성을 측정하는 지표로, 한 변수를 알 때 다른 변수에 대해 얻을 수 있는 정보의 양을 나타냅니다.
RLVR 학습 효율 2.2배 향상, 가중 상호 정보량으로 데이터 선택 최적화