장기 기억 평가 벤치마크
AI 모델의 장기 기억 능력을 측정하기 위한 벤치마크 데이터셋이다. 긴 대화 맥락에서 정보를 얼마나 정확하게 추출하고 유지하며 활용하는지를 평가하는 지표로 사용된다.