분산 부분 관측 마르코프 결정 과정(dec-pomdp)이란 무엇인가요?

Question

Accepted Answer

여러 에이전트가 각자 제한된 정보만 가진 상태에서 공동의 목표를 달성하기 위해 의사결정을 내리는 수학적 프레임워크이다. 본 논문에서는 에이전트의 동적 생성과 소멸을 포함하도록 이를 확장하여 LLM 기반 멀티 에이전트 시스템을 모델링한다.

dec-pomdp