직접 비디오 액션
Rhoda AI가 제안한 방식으로, 로봇의 행동을 직접 예측하는 대신 미래의 비디오 프레임을 먼저 생성하고 이를 기반으로 필요한 움직임을 역산하는 제어 기법이다. 대규모 비디오 데이터를 통해 물리적 법칙을 학습할 수 있다는 장점이 있다.