complexfuncbench
여러 제약 조건이 있는 다단계 함수 호출 능력을 평가하기 위한 벤치마크 지표이다. 모델이 실제 복잡한 비즈니스 로직을 얼마나 정확하게 처리하는지 측정하는 데 사용된다.
Gemini 2.5 Flash, 실시간 통역과 정교한 음성 에이전트로 진화