complex-func-bench
다양한 제약 조건이 포함된 다단계 기능 호출 능력을 평가하기 위한 벤치마크 도구이다. 모델이 복잡한 업무 워크플로를 얼마나 잘 처리하는지 측정하는 척도가 된다.
구글 Gemini 2.5 Flash, 실시간 통역과 정교한 음성 에이전트 시대를 열다