바늘 찾기 테스트
긴 텍스트 뭉치 속에 특정 정보를 숨겨두고 모델이 이를 정확히 찾아내는지 측정하는 벤치마크이다. 모델의 장기 기억력과 컨텍스트 윈도우 활용 능력을 평가하는 표준적인 방법으로 활용된다.