본문으로 건너뛰기
멀티 에이전트 그룹 상대 정책 최적화 (m-grpo) 용어 설명 | AI Trends