본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
평가 하네스 (eval-harness) 용어 설명 | AI Trends
eval-harness
평가 하네스
중급
AI 모델이나 에이전트의 성능을 특정 벤치마크나 시나리오에서 측정하기 위한 테스트 환경 및 도구 모음이다.
비슷한 개념
harness
evaluation-harness
evaluation-framework
evals
benchmark
benchmarks
agent-evaluation
agentic-eval
← 용어 사전 전체 보기