바퀴형 로봇
바퀴를 이용해 평지를 이동하는 로봇으로, 제어가 상대적으로 단순하여 강화학습 입문용으로 자주 활용된다. 바퀴의 회전 속도와 방향을 조절하여 목표 지점까지 최단 거리로 이동하는 정책을 학습하는 것이 일반적이다.