핵심 요약
구글이 자사 최신 기반 모델인 제미나이 3(Gemini 3)를 공식 출시하며 AI 시장의 주도권 확보에 나섰다. 제미나이 3는 제미나이 앱과 AI 검색에 통합되었으며, 연구용 단계인 제미나이 3 딥싱크(Deepthink)도 함께 공개되었다. 특히 수학, 코딩, 시각적 추론 등 주요 벤치마크에서 GPT-5.1 및 클로드 소네트 4.5를 상회하는 성능을 기록하며 기술적 우위를 입증했다. 이번 발표 이후 알파벳(Alphabet)의 주가는 급등하며 기업 가치 4조 달러 달성에 박차를 가하고 있다.
배경
대형 언어 모델(LLM)의 기본 개념, 주요 AI 벤치마크 지표에 대한 이해, 멀티모달 및 에이전트 기술의 기초 지식
대상 독자
AI 모델 성능을 비교 분석하는 연구자 및 엔터프라이즈 AI 도입 결정권자
의미 / 영향
구글이 제미나이 3를 통해 다시 한번 기술적 우위를 점하며 오픈AI와 앤스로픽과의 경쟁 구도를 재편하고 있다. 특히 에이전트 성능과 화면 이해도의 비약적 향상은 AI가 단순 챗봇을 넘어 실제 OS나 앱을 제어하는 에이전트로 진화하는 속도를 앞당길 것이다.
섹션별 상세
이미지 분석

제미나이 3 Pro가 수학, 코딩, 시각적 추론 등 거의 모든 지표에서 경쟁 모델을 압도함을 보여준다. 특히 ScreenSpot-Pro(72.7%)와 MathArena Apex(23.4%)에서 타 모델 대비 압도적인 격차를 확인할 수 있으며, 이는 모델의 실질적인 추론 및 이해 능력이 크게 개선되었음을 증명한다.
제미나이 3 Pro와 경쟁 모델들(Gemini 2.5 Pro, Claude Sonnet 4.5, GPT-5.1)의 20개 이상의 벤치마크 성능 비교표이다.
실무 Takeaway
- 제미나이 3 Pro는 수학(AIME 2025 100%) 및 코딩(LiveCodeBench Pro 2,439점) 분야에서 현존 모델 중 최고 수준의 성능을 제공한다.
- 화면 이해(ScreenSpot-Pro)와 에이전트 작업(Vending-Bench 2) 성능이 비약적으로 향상되어 복잡한 워크플로 자동화에 적합하다.
- 제미나이 3 딥싱크(Deepthink)와 같은 연구용 티어를 통해 고도의 논리적 추론이 필요한 전문 영역으로의 확장이 기대된다.
AI 요약 · 북마크 · 개인 피드 설정 — 무료