초등 수학 문장제 데이터셋
8,500개의 초등 수준 수학 문제로 구성된 벤치마크로, 모델의 다단계 추론 능력을 평가하는 데 널리 사용된다.
LLM 추론 속도 2배 향상, 정답에 영향 없는 오답은 그냥 넘어가라