Zero-shot DRIS로 제로샷 시뮬-실전 전이 달성
Dexterous manipulation은 접촉-rich·동적 환경에서 파라미터 불확실성과 센서 노이즈에 취약하다. 기존의 domain randomization은 에피소드당 한 인스턴스만 변화를 주어 현실 다변성에 충분히 노출되지 않는 한계가 있다. DRIS는 다중 인스턴스를 병렬로 모델링하고 공유된 행동 아래 상태를 함께 진전시킴으로써 불확실한 물리적 변동성을 더 풍부하게 근사하고, 시뮬레이션-현실 간 차이를 줄여 제로샷 transfer를 가능하게 한다. 시뮬레이션 학습에서 DRIS 크기 N이 증가할수록 안정성과 일반화가 향상되며, 실세계에서의 미세 튜닝 필요를 완화한다.