당혹도
언어 모델이 다음 토큰을 얼마나 잘 예측하는지 나타내는 지표로 값이 낮을수록 모델의 예측 성능이 좋음을 의미한다. 확률 분포의 불확실성을 측정하며 모델 간의 성능 비교에 필수적인 척도로 활용된다.