MMMU 프로
대학 수준의 지식이 필요한 복잡한 멀티모달 추론 작업을 평가하는 벤치마크이다. 텍스트뿐만 아니라 이미지, 도표, 수식 등을 복합적으로 이해하고 논리적으로 사고해야 풀 수 있는 문제들로 구성되어 모델의 시각적 이해도를 정밀하게 측정한다.