컴플렉스 펑크 벤치
여러 제약 조건이 있는 다단계 함수 호출 능력을 평가하기 위한 벤치마크 지표이다. 모델이 실제 복잡한 비즈니스 로직을 얼마나 정확하게 처리하는지 측정하는 데 사용된다.