델타 포즈 행동 표현
엔드이펙터의 상대적 위치 변화(Δx,Δy,Δz), 방향 변화(3차원 axis-angle), 그리고 그리퍼 명령을 포함하는 7차원 행동 표현 방식이다. 상대 변화를 예측하면 전역 좌표계에 무관한 지역적 상호작용 역학을 학습할 수 있어 다른 로봇/워크스페이스로의 전이가 용이해진다. 본 논문에서는 이 표현을 액션 공간으로 채택해 ID 및 BC 학습에 사용했다.