마인드트라이얼
AI 모델의 성능을 평가하기 위해 98개의 태스크로 구성된 커스텀 벤치마크 리더보드이다. 모델의 텍스트 추론, 시각적 이해, 코드 작성 능력 등을 종합적으로 측정한다.