본문으로 건너뛰기

ctde

중앙 집중식 학습 및 분산 실행

중급

멀티 에이전트 강화학습에서 학습 시에는 모든 에이전트의 정보를 활용하여 중앙에서 모델을 훈련시키고, 실제 실행 시에는 각 에이전트가 자신의 관측값만으로 의사결정을 내리는 방식이다. 이는 통신 제약이 있는 환경에서 협업 정책을 효율적으로 학습시키는 데 중요하다.