건더미 속 바늘 찾기
방대한 양의 텍스트 데이터(건더미) 속에 아주 작은 특정 정보(바늘)를 삽입한 뒤, 모델이 이를 정확하게 찾아내는지 측정하는 벤치마크이다. 모델의 장기 기억 능력과 컨텍스트 윈도우 활용 능력을 평가하는 핵심 지표로 사용된다.