본문으로 건너뛰기

approximate-dynamic-programming

근사 동적 계획법

고급

복잡한 최적 제어 문제를 해결하기 위해 가치 함수나 정책을 근사화하여 계산 효율을 높이는 방법이다. 현대의 심층 강화학습(Deep RL)과 밀접한 관련이 있다.