부분 관측 마르코프 결정 과정
에이전트가 시스템의 정확한 상태를 알 수 없고 불완전한 관측값만을 가질 때의 의사결정 모델이다. 현재 상태에 대한 확률적 추정을 유지해야 하므로 일반적인 MDP보다 계산 복잡도가 훨씬 높다.
파편화된 POMDP 연구를 하나로 묶는 통합 파이썬 프레임워크 등장
파편화된 POMDP 연구를 하나로, 통합 플래닝 프레임워크 등장
AI와 제어 이론의 충돌: 왜 최적화만으로는 안전한 시스템을 만들 수 없는가