핵심 요약
구글이 지난 11월 제미나이 3를 출시한 데 이어 성능이 개선된 제미나이 3.1 프로를 프리뷰 형태로 공개했다. 이번 업데이트는 모델의 핵심 지능을 높여 복잡한 문제 해결과 추론 능력을 강화하는 데 집중했다. 특히 고난도 지식 측정 벤치마크인 'Humanity's Last Exam'에서 44.4%라는 역대 최고 점수를 기록하며 경쟁 모델들을 앞질렀다. 현재 개발자와 일반 사용자 모두 프리뷰 버전을 통해 새로운 모델의 성능을 경험할 수 있다.
배경
Gemini 모델 시리즈에 대한 기본 지식, LLM 벤치마크 지표에 대한 이해
대상 독자
AI 모델 성능 변화에 민감한 개발자 및 기술 분석가
의미 / 영향
구글이 모델 업데이트 주기를 단축하며 추론 성능 경쟁에서 우위를 점하려 하고 있다. 특히 고난도 벤치마크에서의 성과는 전문적인 영역에서의 AI 활용 가능성을 높인다.
섹션별 상세
구글은 제미나이 3 출시 이후 빠르게 후속 버전인 제미나이 3.1 프로를 발표했다. 이번 모델은 개발자와 소비자용 프리뷰 버전으로 먼저 제공되며 기존 모델 대비 향상된 문제 해결 능력과 추론 성능을 제공하는 것이 특징이다. 지난주 발표된 'Deep Think' 도구 업데이트의 핵심 지능 역시 이 제미나이 3.1 프로를 기반으로 구축되었다.
성능 평가 지표인 벤치마크 결과에서 제미나이 3.1 프로는 유의미한 성장을 보여주었다. 고도의 전문 지식을 테스트하는 'Humanity's Last Exam' 벤치마크에서 44.4%의 점수를 기록하며 기존 제미나이 3 프로의 37.5%를 넘어섰다. 이는 경쟁사인 OpenAI의 GPT 5.2가 기록한 34.5%보다 높은 수치로 특정 도메인에서의 우위를 입증했다.
실무 Takeaway
- 제미나이 3.1 프로는 추론 능력이 강화되어 복잡한 논리적 사고가 필요한 작업에 더 적합하다.
- Humanity's Last Exam 벤치마크 점수 향상은 AI의 전문 지식 이해도가 지속적으로 정교해지고 있음을 시사한다.
- 구글의 빠른 모델 업데이트 주기는 AI 시장에서의 기술 주도권 경쟁이 매우 치열함을 보여준다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료