본문으로 건너뛰기

probability-mass

확률 질량

중급

모델이 다음에 올 토큰을 예측할 때 각 후보에 할당하는 확률의 분포를 의미한다. 단계별 추론을 거치면 잘못된 답변의 확률은 낮아지고 정답에 해당하는 토큰의 확률이 집중되는 효과가 발생한다.