멀티홉 질의응답
단일 문장에서 답을 찾는 것이 아니라 여러 문서나 문장에 흩어져 있는 정보 조각들을 연결하고 추론해야 답변이 가능한 복합적인 질의응답 작업이다. 모델의 장기 기억력과 복잡한 문맥 이해 능력을 평가하는 핵심 지표로 활용된다.