본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항 일자별 아카이브

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침 이용약관

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티 탐색 보관함

홈 트렌딩 커뮤니티 보관함 프로필

agentic-evals

에이전트 기반 평가

중급

AI 모델이 단순히 텍스트를 생성하는 것을 넘어, 실제 환경에서 코드를 작성하고 실행하며 도구를 사용하는 능력을 측정하는 평가 방식이다. 정적 벤치마크와 달리 실행 환경(런타임)의 자원과 설정이 결과에 직접적인 영향을 미친다.

별칭

에이전트 기반 평가

비슷한 개념

agentic-coding-evals agentic-task agentic-benchmark agentic-evaluation agentic-use agent-as-a-judge terminal-bench agentic-capabilities

← 용어 사전 전체 보기