irt
개별 문항의 특성과 응답자의 능력을 확률 모델로 연결하는 통계적 방법론이다. AI 평가에서는 모델의 정답률뿐만 아니라 문제의 난이도와 변별력을 함께 고려하여 역량을 정밀하게 측정하는 데 쓰인다.
"단순 평균의 폭주를 넘어" AI 평가가 진정한 과학으로 진화하는 법