본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
MAPPO (mappo) 용어 설명 | AI Trends
mappo
MAPPO
중급
MAPPO는 다에이전트 PPO를 중앙집중 가치 추정기에 의존해 학습하는 알고리즘으로, 각 에이전트의 정책은 로컬 관찰에 기반하고 공유 가치함수를 활용한다.
비슷한 개념
ctde
m-grpo
multi-agent-learning
marl
dd-ppo
multi-agent-reinforcement-learning
multi-agent-rl
shared-policy
← 용어 사전 전체 보기