신념 공간
에이전트가 현재 상태에 대해 가질 수 있는 모든 가능한 확률 분포의 집합이다. POMDP에서 에이전트는 직접적인 상태 대신 이 신념 공간 위에서 의사결정을 내리며, 이는 불확실성을 수학적으로 관리하는 핵심 메커니즘이다.