과정 감독
최종 결과물뿐만 아니라 모델이 답을 도출하는 중간 사고 단계마다 보상을 주어 논리적 추론 과정을 정렬하는 기법이다. 복잡한 수학 문제나 법률 분석처럼 단계별 정확성이 중요한 작업에서 환각 현상을 획기적으로 줄이고 결과의 신뢰성을 높이는 데 기여한다.