역량 평가
모델이 특정 작업이나 도메인에서 발휘하는 실제 성능을 정량적으로 측정하는 프로세스이다. 단순한 벤치마크 점수가 아닌, 실제 서비스 환경의 요구 사항을 충족하는지 확인하기 위해 설계된다.