ARC-AGI-3
추상 추론 말뭉치(ARC)의 세 번째 버전으로, 정적인 퍼즐 대신 지침이 없는 대화형 게임 환경에서 에이전트의 적응형 추론 능력을 측정한다. 기존 LLM이 학습 데이터의 패턴 매칭에 의존하는 한계를 극복하고 새로운 상황에서의 문제 해결 능력을 평가하는 데 중점을 둔다.