본문으로 건너뛰기

partial-reward

부분 보상

중급

작업을 여러 체크포인트로 쪼갠 뒤 각 체크포인트 달성도를 합산하여 점수를 매기는 방식으로, 평균 27.25개의 체크포인트로 구성된 세밀한 평가를 제공한다. 이 방식은 최종 완성 여부가 아닌 단계별 진척을 정량화하여 긴 호라이즌 작업의 성과를 더 잘 포착한다. OSWorld 2.0에서는 최종 이진 완성도와 함께 부분 보상이 핵심 비교 축으로 사용된다.