approximate-dynamic-programming
복잡한 최적 제어 문제를 해결하기 위해 가치 함수나 정책을 근사화하여 계산 효율을 높이는 방법이다. 현대의 심층 강화학습(Deep RL)과 밀접한 관련이 있다.
제어 이론과 머신러닝의 만남: Ben Recht의 새로운 강의 계획서 공개