다중-핫 크로스 엔트로피
토큰 묶음 y의 각 유효 토큰에 1/|y|의 확률을 할당하는 손실로, L_MCE(z, y) = (1/|y|) Σ_{y∈y} L_CE(z, y) 형태로 정의된다.