크릿피티
물리적 세계에 대한 추론 능력을 측정하는 벤치마크로, 모델이 복잡한 물리 법칙이나 인과 관계를 얼마나 잘 이해하는지 평가한다. GPT-5.4와 같은 최신 모델의 과학적 사고 능력을 검증하는 주요 지표로 활용된다.