Gemini 3 Deep Think: 과학, 연구 및 엔지니어링 분야의 혁신적 발전

핵심 요약

구글 딥마인드가 과학, 연구, 엔지니어링 분야의 복잡한 문제를 해결하기 위해 설계된 Gemini 3 Deep Think의 대규모 업데이트를 발표했다. 이번 업데이트는 정답이 불분명하거나 데이터가 불완전한 실제 연구 환경에서 추론 능력을 극대화하는 데 초점을 맞췄다. Humanity's Last Exam과 ARC-AGI-2 등 고난도 벤치마크에서 신기록을 경신했으며, 수학적 증명 검토 및 반도체 소재 최적화 등 실질적인 성과를 입증했다. 현재 구글 AI Ultra 구독자에게 제공되며, Gemini API를 통한 조기 액세스 프로그램도 시작되었다.

배경

LLM 추론 메커니즘에 대한 이해, 과학 및 엔지니어링 도메인 지식

대상 독자

과학 연구자, 하드웨어 및 소프트웨어 엔지니어, AI 연구원

의미 / 영향

이 모델의 등장은 AI가 단순 보조 도구를 넘어 과학적 발견과 복잡한 엔지니어링 설계의 핵심 파트너로 자리 잡을 것임을 예고한다. 특히 고난도 벤치마크에서의 압도적 성능은 AGI(인공일반지능)로 향하는 추론 기술의 비약적인 발전을 의미한다.

섹션별 상세

Gemini 3 Deep Think는 과학적 지식과 엔지니어링 실무 능력을 결합하여 복잡한 추론 문제를 해결한다. 럿거스 대학교의 수학자는 이 모델을 사용하여 인간 동료 검토자들도 발견하지 못한 고도의 기술 수학 논문 내 논리적 오류를 식별하는 데 성공했다. 듀크 대학교 왕 연구실에서는 반도체 소재 개발을 위한 복잡한 결정 성장 공정을 최적화하여 기존 방식으로는 어려웠던 100μm 이상의 박막 제조 레시피를 설계했다.

추론 성능 측면에서 다양한 학술 벤치마크의 한계를 돌파하며 새로운 표준을 제시했다. 현대 프런티어 모델의 한계를 테스트하는 Humanity's Last Exam에서 도구 사용 없이 48.4%라는 신기록을 세웠으며, ARC-AGI-2에서는 84.6%라는 전례 없는 점수를 기록했다. 또한 경쟁 프로그래밍 플랫폼인 Codeforces에서 3455의 Elo 레이팅을 달성하고 2025년 국제 수학 올림피아드(IMO) 금메달 수준의 성능을 보여주었다.

수학과 코딩을 넘어 물리, 화학 등 광범위한 과학 도메인으로 전문성을 확장했다. 2025년 국제 물리 및 화학 올림피아드 필기 섹션에서 금메달 수준의 결과를 얻었으며, 고급 이론 물리학 벤치마크인 CMT-Benchmark에서 50.5%의 점수를 획득했다. 이러한 성능은 모델이 단순한 텍스트 생성을 넘어 깊이 있는 과학적 원리를 이해하고 적용할 수 있음을 시사한다.

실제 엔지니어링 워크플로우를 가속화하기 위해 스케치를 3D 출력 가능한 모델로 변환하는 기능을 지원한다. 사용자가 그린 복잡한 형상의 스케치를 분석하여 3D 모델링을 수행하고, 이를 실제 물리적 객체로 제작할 수 있는 파일을 생성한다. 이는 추상적인 이론적 추론을 실질적인 제조 및 설계 공정으로 연결하는 구체적인 사례로 평가받는다.

이미지 분석

Chart
Humanity's Last Exam, ARC-AGI-2, Codeforces 등 주요 지표에서 기존 모델 대비 향상된 성능 수치를 시각적으로 제시한다. 특히 ARC-AGI-2에서 84.6%를 기록하며 추론 능력의 비약적 발전을 증명한다.
Gemini 3 Deep Think의 주요 벤치마크 성능을 보여주는 막대 그래프이다.

Chart
물리 및 화학 올림피아드, CMT-Benchmark 등 구체적인 도메인별 점수를 나열하여 모델의 전문성을 입증한다. 이론 물리학 벤치마크에서 50.5%의 점수를 획득한 성과가 명시되어 있다.
다양한 과학 및 수학 벤치마크 결과를 정리한 상세 비교 표이다.

실무 Takeaway

Gemini 3 Deep Think는 고도의 수학적 논증에서 인간 전문가가 놓친 오류를 찾아낼 만큼 정교한 추론 능력을 갖췄다.
ARC-AGI-2 84.6% 달성은 AI의 범용 추론 능력이 새로운 단계에 진입했음을 보여주는 중요한 지표이다.
단순 텍스트 기반 상호작용을 넘어 3D 모델링 파일 생성 등 실질적인 엔지니어링 도구로서의 활용도가 높아졌다.

언급된 리소스

API DocsGemini API Early Access Interest Form