소프트웨어 엔지니어링 벤치마크
실제 GitHub 이슈를 해결하는 능력을 통해 AI 모델의 실질적인 코딩 및 소프트웨어 개발 역량을 검증하는 지표이다.
구글 Gemini 3.1 Pro 공개: 가격 동결에 추론 성능은 2배 점프
구글 Gemini 3.1 Pro 공개, 가격은 그대로 성능은 2배
구글 Gemini 3 Flash 공개: 2.5 Pro보다 빠르고 강력한 성능