본문으로 건너뛰기
deep-research-bench
딥 리서치 벤치마크
중급
AI 에이전트의 심층 연구 능력을 평가하기 위한 벤치마크로, 보고서의 포괄성, 통찰력의 깊이, 지시 이행 능력 및 정보 회상 정확도를 측정한다.
비슷한 개념
agentic-benchmark
deep-research-agent
agent-evals
benchmark
metr-benchmark
evals
benchmarks
tau-bench
← 용어 사전 전체 보기
AI Trends
피드
트렌딩
커뮤니티
로그인
홈
트렌딩
검색
커뮤니티
프로필