marl
다수의 에이전트가 공통의 환경에서 상호작용하며 학습하는 강화학습의 한 분야이다. 각 에이전트의 행동이 다른 에이전트에게 영향을 미치므로 복잡도가 높으며, 협력이나 경쟁 관계를 모델링하는 데 중요하다.
변화하는 환경에 대응하라, MARL 기반 개방형 에이전트 시스템 경진대회
MARL의 블랙박스를 깨다: 정형 추론으로 구현하는 1,000개 에이전트의 안정성
물리학과 강화학습의 만남: Lean 4로 검증하는 에너지 보존 MARL
구글 딥마인드 AlphaEvolve, 스스로 진화하며 인간을 뛰어넘는 AI 알고리즘 설계
MARL과 LP의 결합: 물류 최적화의 새로운 하이브리드 아키텍처