추상 추론 벤치마크
인간의 지능과 유사한 일반적인 문제 해결 능력을 측정하는 테스트이다. 모델이 이전에 학습하지 않은 새로운 규칙과 패턴을 얼마나 잘 파악하고 실시간으로 적응하여 해결하는지 평가하며 지능의 핵심 지표로 활용된다.