공유 정책
멀티에이전트 강화학습에서 여러 에이전트가 동일한 신경망 파라미터를 공유하여 학습 속도를 높이고 협업 효율을 개선하는 방식이다.
DQN부터 PPO까지, 직접 만든 RL 토이 게임 5종 세트
DQN부터 PPO까지, 직접 만든 게임으로 배우는 강화학습 프로젝트