본문으로 건너뛰기

bellman-optimality

벨만 최적성

고급

현재 상태의 최적 가치가 미래 상태의 최적 가치와 즉각적 보상의 합으로 표현된다는 원리이다. 이를 통해 복잡한 문제를 작은 부분 문제로 나누어 해결하는 동적 계획법의 기초가 된다.