평가 데이터셋
AI 모델이나 시스템의 성능을 객관적으로 측정하기 위해 마련된 질문과 정답의 집합이다. 본문에서는 30개의 질문을 통해 mdlens 도구의 정확도와 비용 효율성을 검증하는 용도로 사용됐다.