잔차 가치 예측기
현재 상태의 절대적인 가치를 직접 예측하는 대신, 이전 단계와 비교했을 때 얼마나 진전이 있었는지를 측정하는 도구입니다. 이를 통해 LLM 특유의 과잉 확신 문제를 완화하고, 실제로 정답에 가까워지고 있는 경로를 더 정확하게 식별할 수 있게 합니다.