본문으로 건너뛰기

task-resolution

작업 해결률

중급

주어진 프로그래밍 과제나 버그 수정을 성공적으로 완료한 비율을 나타내는 지표이다. 벤치마크 테스트에서 모델의 실질적인 문제 해결 성능을 수치화한다. Codeset 적용 전후의 수치 변화를 통해 도구의 유효성을 증명하는 근거가 된다.