본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
고전 검사 이론 (classical-test-theory) 용어 설명 | AI Trends
classical-test-theory
고전 검사 이론
고급
심리측정학에서 검사의 신뢰도와 타당도를 평가하기 위한 이론으로, 본 논문에서는 에이전트의 능력을 정밀하게 측정하는 벤치마크 설계의 기초로 활용됨.
비슷한 개념
benchmark
evals
agentic-benchmark
metr-benchmark
agentic-reliability
irt
item-response-theory
deep-research-bench
← 용어 사전 전체 보기