본문으로 건너뛰기
deep-research-bench
딥 리서치 벤치마크
중급
AI 에이전트의 심층 연구 능력을 평가하기 위한 벤치마크로, 보고서의 포괄성, 통찰력의 깊이, 지시 이행 능력 및 정보 회상 정확도를 측정한다.
비슷한 개념
agentic-benchmark
deep-research-agent
benchmark
metr-benchmark
evals
benchmarks
tau-bench
gaia-benchmark
← 용어 사전 전체 보기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지