LongMemEval-S
LLM의 장기 기억 능력을 측정하기 위한 벤치마크 데이터셋이다. 긴 문맥 속에서 과거의 정보를 얼마나 정확하게 회상하고 활용하는지를 수치화하여 모델이나 메모리 시스템의 성능을 평가한다.