본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
지시사항 이행 평가 (ifeval) 용어 설명 | AI Trends
ifeval
지시사항 이행 평가
중급
모델이 사용자의 복잡한 제약 조건이나 지시사항을 얼마나 정확하게 따르는지 평가하는 벤치마크이다. 인스트럭트 모델의 실질적인 활용 능력을 측정하는 데 중요하다.
비슷한 개념
ifbench
instruction-following
instruct-model
agentic-benchmark
benchmarks
prompt-complexity
answer-relevancy
evals
← 용어 사전 전체 보기