본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
컴플렉스 펑크 벤치 (complex-func-bench) 용어 설명 | AI Trends
complex-func-bench
컴플렉스 펑크 벤치
고급
다양한 제약 조건이 포함된 다단계 기능 호출 능력을 평가하기 위한 벤치마크 도구이다. 모델이 복잡한 업무 워크플로를 얼마나 잘 처리하는지 측정하는 척도가 된다.
비슷한 개념
complexfuncbench
ifbench
agentic-benchmark
metr-benchmark
complex-task
tau-bench
ifeval
ai-benchmark
← 용어 사전 전체 보기