프라이빗 평가
공개된 벤치마크가 아닌 기업 내부의 특정 데이터와 요구사항을 기준으로 모델 성능을 측정하는 방식이다. 모델의 실질적인 비즈니스 가치를 검증하고, 지속적인 성능 개선을 위한 핵심 IP로 활용된다.