후퇴 수평 제어
유한한 미래 시간 구간에 대해 최적화 문제를 풀고 첫 번째 제어 입력만 적용한 뒤, 다음 시점에서 구간을 이동하며 반복하는 방식이다.
전기차 배터리 관리, RL과 MPC 중 무엇이 더 효율적일까?
강화학습 vs MPC: 전기차 배터리 제어의 승자는 누구인가