review-schema
데이터를 평가하거나 검토할 때 따르는 구조화된 규칙이나 형식의 틀이다. 어떤 항목을 어떤 기준으로 점수화하거나 서술할지 정의함으로써 평가의 일관성과 재현성을 보장하는 역할을 한다.
AI 에이전트 성능 측정, 어떤 벤치마크 스키마가 가장 정확할까?