AI 모델 성능 벤치마크 순위 (Visual Score 기준)

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

이 데이터는 다양한 AI 모델의 Visual Score를 기준으로 한 성능 벤치마크 순위를 나타낸다. Gemini 3.1 Pro가 40.93점으로 1위를 차지했으며, 뒤를 이어 Gemini 3 Flash와 GPT-5.5가 상위권에 위치했다. 각 모델은 공식 API 또는 프록시 API를 통해 측정되었으며, 추론 모드 설정에 따라 성능 차이를 보인다. 이 순위는 모델별 시각적 이해 능력과 추론 성능을 객관적으로 비교하는 지표를 제공한다.

대상 독자

AI 모델 성능 비교 및 벤치마크에 관심 있는 개발자 및 연구자

섹션별 상세

Gemini 3.1 Pro가 Visual Score 40.93점으로 전체 1위를 기록하며 가장 높은 성능을 보였다.

Gemini 3 Flash와 GPT-5.5가 각각 2위와 3위를 차지하며 상위권 경쟁을 형성했다.

Qwen3.6-Max-Preview와 DeepSeek v4 Pro 등 다양한 모델이 Thinking mode를 활성화하여 추론 성능을 최적화했다.

모델별로 Official API와 Cloudflare Proxy API 등 서로 다른 접근 방식을 사용하였으며, 이는 성능 측정 결과에 영향을 미쳤다.