입력 성형
시스템의 잔류 진동을 억제하기 위해 제어 명령의 형태를 조절하는 제어 기법이다. 본 게시물에서는 강화학습 에이전트가 보상 구조와 물리 법칙을 학습하여 크레인의 화물 흔들림을 최소화하는 제어 패턴을 스스로 생성하는 현상을 설명하는 데 사용됐다.