본문으로 건너뛰기

shared-policy

공유 정책

중급

멀티에이전트 강화학습에서 여러 에이전트가 동일한 신경망 파라미터를 공유하여 학습 속도를 높이고 협업 효율을 개선하는 방식이다.