imitation-learning
에이전트가 보상 함수를 직접 최적화하는 대신 전문가의 시연을 보고 최적의 행동을 배우는 강화학습의 한 분야이다.
월 6TB 데이터와 A6000 한 대로 시작하는 ML 인프라 구축, 커리어에 도움 될까?
내가 하는 걸 보고 배운다? 격투 게임 고수 AI 만들기
내가 게임하는 모습을 보고 그대로 따라 하는 AI 만들기
11초 만에 공중제비 10번, AI로 진화한 초소형 로봇의 비행