목표 조건부 강화학습
에이전트가 고정된 하나의 작업만 수행하는 것이 아니라, 입력으로 주어지는 다양한 '목표 상태(Goal)'에 도달하도록 학습하는 강화학습 방식이다. 이를 통해 하나의 정책으로 수많은 서로 다른 위치나 포즈로 물체를 이동시키는 범용적인 능력을 갖출 수 있다.