오피스QA
Databricks가 개발한 벤치마크로, 방대한 양의 전문 문서를 기반으로 정보 검색, 복잡한 표 해석, 정밀한 계산 능력을 측정한다. 실제 기업 환경에서 발생하는 다단계 분석 작업에 대한 모델의 성능을 평가하는 척도로 사용된다.