CharXiv 추론
차트, 그래프 등 시각적 자료를 기반으로 한 논리적 추론 능력을 평가하는 벤치마크이다. Muse Spark는 이 지표에서 86.4점을 기록하며 과학적 도표 해석 및 데이터 분석 역량이 뛰어남을 보여주었다.