이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.
핵심 요약
로봇 제어가 단순한 조작을 넘어 전신의 균형을 잡으며 복합적인 작업을 수행하는 단계로 진화하고 있다. 이를 위해 강화학습(RL)과 계층적 제어 아키텍처가 핵심적인 역할을 수행하며 실용성을 높이고 있다.
배경
Figure AI가 새로운 비전-언어-액션 모델 Helix 02를 공개하며 상체 위주의 제어를 넘어 하체까지 활용하는 전신 제어 시대를 열었다.
대상 독자
로보틱스 개발자, AI 연구원, 최신 기술 트렌드에 관심 있는 엔지니어
의미 / 영향
로봇 기술이 이동과 조작이 분리된 형태에서 하나로 통합된 로코-매니퓰레이션 시대로 접어들고 있다. 이는 물류, 가사 노동 등 복잡한 실제 환경에서 로봇의 실용성을 비약적으로 높이는 계기가 될 것이며, 연구용 플랫폼의 공개로 기술 발전 속도가 더욱 빨라질 것이다.
챕터별 상세
00:00
Intro - Figure Helix 02
Figure AI가 공개한 Helix 02 모델은 기존 Helix 01의 상체 제어를 넘어 하체까지 포함한 전신 제어를 지원한다. 물류 현장에서 물건을 옮기는 작업 시 단순히 팔만 쓰는 것이 아니라 몸 전체의 반동과 균형을 활용한다. 이는 로봇이 실제 작업 환경에서 더 넓은 범위를 커버하고 효율적으로 움직일 수 있게 한다.
00:28
Whole-body Control의 의미
제자리에서 수행하는 단순 작업 외에 실제 환경에서는 미세한 움직임과 위치 조정이 필수적이다. 테이블 위를 넓게 커버하거나 장애물을 피하기 위해 전신을 유기적으로 제어하는 능력이 로봇의 실용성을 결정한다. 상체 고정 방식의 한계를 극복하고 하체와 골반을 활용한 유연한 동작이 가능해졌다.
00:47
골반 밀기 & 발차기 Demo
Helix 02가 식기세척기 문을 골반으로 밀어 닫거나 발로 차서 닫는 데모를 통해 전신 균형 유지 능력을 입증했다. 한 발로 서서 균형을 잡는 동작은 로봇 제어에서 매우 높은 난이도를 요구하는 작업이다. 외부 충격이나 급격한 자세 변화에도 자빠지지 않고 밸런스를 유지하는 성능을 보여주었다.
01:50
System 0, 1, 2 Architecture
Figure는 제어 계층을 System 0, 1, 2로 구분하여 운영한다. System 0은 1kHz의 고주파수로 작동하며 인간과 유사한 안정적인 모션 트래킹을 담당한다. System 1은 200Hz로 비전-모터 학습을 수행하고, System 2는 저주파수로 고수준의 추론 및 언어 이해를 처리한다.
03:28
Tactile Sensor & Hand Sensing
로봇 손가락 끝에 추가된 촉각 센서를 통해 병뚜껑을 여는 것과 같은 정밀한 조작이 가능해졌다. 센서 데이터가 있을 때와 없을 때의 조작 성공률 차이가 명확하게 드러나는 데모를 공개했다. 이는 시각 정보만으로는 부족한 미세한 힘 조절과 접촉 감지를 보완한다.
04:04
Boston Dynamics Whole-body Teleop
보스턴 다이내믹스의 전신 원격 조작 시스템은 사람의 관절 값을 로봇에 그대로 복사하는 것이 아니라 로봇의 물리적 특성에 맞춰 리타겟팅한다. 이를 통해 사람이 한 발로 서면 로봇도 실시간으로 균형을 잡으며 따라 한다. 로봇의 하드웨어 한계를 고려하면서도 사람의 의도를 정확히 반영하는 제어 기술이다.
05:40
Fauna Robotics - Sprout 로봇
Fauna Robotics가 공개한 Sprout는 연구용으로 설계된 경량 휴머노이드 로봇이다. 22.7kg의 가벼운 무게와 소프트한 외장재를 사용하여 인간과 안전하게 공존할 수 있도록 설계되었다. 29자유도(DoF)를 갖추고 있으며 개발자가 쉽게 접근할 수 있는 플랫폼을 지향한다.
07:32
논문 공개 & Tech Stack
Sprout는 상세한 하드웨어 스펙과 소프트웨어 스택을 논문으로 공개했다. NVIDIA Jetson AGX Orin을 탑재하고 Isaac Sim을 활용한 강화학습으로 제어 모델을 학습시켰다. 하드웨어 설계부터 제어 알고리즘까지 투명하게 공개하여 로봇 연구 커뮤니티에 기여하고 있다.
08:53
RL 기반 Loco-manipulation
걷기, 기어가기, 앉기 등 다양한 포즈 사이의 전환을 강화학습(RL)으로 구현했다. 각 동작 모드별로 최적화된 정책(Policy)이 존재하며, 상황에 따라 이를 부드럽게 전환하는 스테이트 머신(State Machine) 구조를 가진다. 시뮬레이션에서 학습된 정책을 실제 로봇에 적용하는 Sim-to-Real 과정을 거쳤다.
11:08
Tech Stack 정리 & Loco-manipulation 번들링
고수준의 VLA/LLM 에이전트부터 저수준의 모터 제어까지 계층화된 구조를 가진다. 전신 제어와 조작이 결합된 '로코-매니퓰레이션'이 하나의 패키지로 제공되어 연구 효율을 높인다. 기존의 개별적인 제어 방식에서 벗어나 통합된 동작 라이브러리를 구축하는 추세이다.
13:10
정리 - Loco-manipulation 시대
로봇 기술이 단순 조작(Manipulation)에서 이동과 조작이 결합된 단계로 넘어가고 있다. VLA 모델이 발전함에 따라 복잡한 아키텍처가 점차 엔드투엔드(End-to-End) 방식으로 통합될 가능성이 높다. 로봇이 인간의 공간에서 안전하고 유능하게 활동하기 위한 기술적 토대가 마련되고 있다.
실무 Takeaway
- 휴머노이드 로봇은 단순한 팔 동작을 넘어 전신의 무게 중심을 활용하는 전신 제어(Whole-body Control) 단계로 진화하고 있다.
- 로봇 제어 아키텍처를 System 0/1/2와 같이 계층화함으로써 고수준의 추론과 저수준의 실시간 안정성을 동시에 확보할 수 있다.
- 강화학습(RL)을 통해 다양한 동작 모드 간의 부드러운 전환을 구현하는 것이 로코-매니퓰레이션의 핵심 기술이다.
- 촉각 센서의 도입은 시각 정보만으로 해결하기 어려운 미세 조작의 성공률을 비약적으로 높여준다.
언급된 리소스
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
원문 발행 2026. 02. 05.수집 2026. 02. 21.출처 타입 YOUTUBE
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.