분포 외 벤치마크
학습 데이터에 포함되지 않은 낯선 환경이나 상황에서의 모델 적응력과 일반화 성능을 측정하는 기준이다.
44,000시간의 인간 행동을 배운 로봇, 물리 법칙을 깨우치다