부분 관측 마르코프 결정 과정
에이전트가 시스템의 정확한 상태를 알 수 없고 불완전한 관측값만을 가질 때의 의사결정 모델이다. 현재 상태에 대한 확률적 추정을 유지해야 하므로 일반적인 MDP보다 계산 복잡도가 훨씬 높다.