본문으로 건너뛰기

피드 트렌딩 커뮤니티 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 커뮤니티 공지

피드 트렌딩 커뮤니티 공지

AIRS-벤치 (airs-bench) 용어 설명 | AI Trends

airs-bench

AIRS-벤치

중급

AIRS-Bench는 LLM 연구 에이전트를 평가하는 표준 벤치마크로서 Composer, LRA, Autoresearch 등 서로 다른 연구 문제를 포함하는 연구 루프의 구축/평가 프레이임워크를 제공한다.

비슷한 개념

evals deep-research-bench agentic-benchmark openharness llm-ranking metr-benchmark benchmarks agentic-index

← 용어 사전 전체 보기