본문으로 건너뛰기

deep-research-bench

딥 리서치 벤치마크

중급

AI 에이전트의 심층 연구 능력을 평가하기 위한 벤치마크로, 보고서의 포괄성, 통찰력의 깊이, 지시 이행 능력 및 정보 회상 정확도를 측정한다.