dynamic-programming
복잡한 문제를 여러 개의 작은 하위 문제로 나누어 해결하는 최적화 방법론이다. 제어 이론에서는 벨만 방정식을 통해 시간에 따라 변화하는 시스템의 최적 의사결정 경로를 찾는 데 핵심적으로 사용된다.
제어는 단순한 최적화가 아니다? 최적 제어와 강화학습의 본질적 차이
주차 자리 찾느라 35분 낭비? AI가 최적의 주차장과 경로를 찾아줍니다
머신러닝과 제어 이론의 결합, 최적 제어를 넘어 피드백의 본질을 묻다