작업 완료율
생성된 결과물이 사전에 정의된 원자적 제약 조건(Oracle Slots)을 얼마나 충족했는지 측정하는 지표이다. 단순한 코드 실행 여부를 넘어 정적 요소, 상호작용 요소, 복잡한 로직 등 각 구성 요소의 구현 난이도에 가중치를 두어 에이전트의 실제 문제 해결 능력을 정밀하게 평가한다.