arc-agi-2
인간의 지능과 유사한 일반적인 문제 해결 능력을 측정하는 테스트이다. 모델이 이전에 학습하지 않은 새로운 규칙과 패턴을 얼마나 잘 파악하고 실시간으로 적응하여 해결하는지 평가하며 지능의 핵심 지표로 활용된다.
구글 Gemini 3.1 Pro 공개: 가격 동결에 추론 성능은 2배 점프
Gemini 3.1 Pro 출시: 추론 성능 2배 향상과 환각률 38% 감소
추론 능력 2배 향상, 구글 Gemini 3.1 Pro 에이전트 시장 정조준
구글 Gemini 3.1 Pro 공개, 가격은 그대로 성능은 2배
구글, 추론 능력 2배 향상된 제미나이 3.1 프로 깜짝 공개