생성적 적대 모방 학습
전문가의 행동 데이터를 GAN(생성적 적대 신경망) 구조에 적용하여 보상 함수를 직접 정의하지 않고도 전문가의 행동을 모방하도록 학습하는 기법이다. 적은 데이터로도 복잡한 행동 패턴을 효과적으로 학습할 수 있다.