시간 지평
AI 모델이 중단이나 오류 없이 자율적으로 작업을 지속하여 성공적으로 완수할 수 있는 시간적 범위를 의미한다. METR 벤치마크에서 모델의 실질적인 업무 수행 능력을 측정하는 핵심 지표로 사용된다.