종합 점수
다수의 하위 태스크나 지표를 결합해 모델의 전반적 성능을 하나의 수치로 나타낸 지표이다. 개별 작업별 정확도·정밀도·성능 지표를 가중치 혹은 평균으로 통합하여 산출하며, 모델 간 전반적 우열을 빠르게 파악할 때 사용된다. 이 그래프에서는 각 모델의 코드 관련 종합 성능을 비교하는 역할을 한다.