핵심 요약
자율주행 기술의 핵심 과제인 안전성을 확보하기 위해 웨이모는 '웨이모 파운데이션 모델(Waymo Foundation Model)'을 기반으로 한 통합 AI 생태계를 구축했다. 이 시스템은 실제 주행을 담당하는 드라이버(Driver), 학습 환경을 제공하는 시뮬레이터(Simulator), 성능을 평가하는 크리틱(Critic)이 하나의 모델을 공유하며 선순환 구조를 형성한다. 특히 대규모 교사 모델을 효율적인 학생 모델로 증류(Distillation)하는 방식과 실시간 추론 및 복잡한 의미론적 추론을 결합한 아키텍처를 통해 실제 도로에서의 사고율을 인간 운전자 대비 10분의 1 수준으로 낮췄다. 이러한 통합적 접근은 데이터의 기하급수적 증가와 맞물려 자율주행 시스템의 지속적인 진화를 가능케 한다.
배경
자율주행 시스템 기초 지식, 지식 증류(Knowledge Distillation) 개념, VLM(Vision Language Model) 및 멀티모달 AI 이해, 강화학습(Reinforcement Learning) 기본 원리
대상 독자
자율주행 기술 개발자, AI 아키텍트, 로보틱스 연구자 및 모빌리티 산업 관계자
의미 / 영향
웨이모의 이번 발표는 단순한 모델 개선을 넘어 시뮬레이션과 평가 시스템이 통합된 AI 생태계의 중요성을 입증한다. 특히 VLM을 주행에 결합하여 희귀 사례 대응 능력을 높인 점은 향후 자율주행 AI가 단순한 패턴 인식을 넘어 고차원적인 상황 이해로 나아가고 있음을 의미한다.
섹션별 상세
이미지 분석
세 가지 핵심 구성 요소가 동일한 AI 기반을 공유하며 통합적으로 작동함을 시각화한다. 이는 안전성을 중심으로 한 웨이모의 홀리스틱(Holistic) 접근 방식을 직관적으로 나타낸다.
웨이모 파운데이션 모델을 공유하는 드라이버, 시뮬레이터, 크리틱의 관계도이다.
다양한 센서 데이터와 텍스트 프롬프트가 입력되어 주행 행동 및 주변 환경 예측으로 이어지는 데이터 흐름을 보여준다. 특히 Gemini 기반의 VLM이 복잡한 의미론적 추론을 담당하는 구조가 명시되어 있다.
센서 퓨전 인코더, 드라이빙 VLM, 월드 디코더로 구성된 웨이모 파운데이션 모델 아키텍처이다.
클라우드 기반의 대규모 교사 모델들이 지식 증류를 통해 온보드 드라이버 등 실시간 실행이 가능한 학생 모델로 변환되는 과정을 설명한다. 이는 모델 성능과 실행 효율성을 동시에 확보하는 전략적 핵심이다.
거대 교사 모델에서 효율적인 학생 모델로 지식이 전이되는 웨이모 AI 생태계 구조이다.

파운데이션 모델을 통해 실제 환경을 가상 세계로 재구성하는 능력을 입증한다. 텍스트 프롬프트와 의미론적 조건을 통해 날씨나 시간대 등 다양한 변수를 시뮬레이션에 적용할 수 있음을 보여준다.
실제 도로 장면이 고도로 사실적인 카메라 및 라이다 시뮬레이션 데이터로 변환되는 과정이다.
실제 주행 데이터와 가상 시뮬레이션이 결합되어 시스템이 지속적으로 자가 학습하고 개선되는 순환 구조를 나타낸다. 내부의 강화학습 루프와 외부의 실전 데이터 루프가 유기적으로 연결되어 있다.
주행, 발견, 학습, 시뮬레이션, 검증, 배포로 이어지는 웨이모 AI 플라이휠 구조이다.
실무 Takeaway
- 자율주행 AI 설계 시 안전성을 사후 보완이 아닌 설계 단계부터 핵심 기반으로 통합하는 'Demonstrably Safe AI' 접근법이 필수적이다.
- 거대 모델(Teacher)의 능력을 실시간 환경(Student)으로 전이하는 지식 증류 기법은 자율주행과 같은 엣지 컴퓨팅 분야에서 성능과 효율성을 동시에 확보하는 핵심 전략이다.
- 실제 주행 데이터와 시뮬레이션 데이터를 유기적으로 결합한 학습 플라이휠을 구축하여 데이터 규모의 경제를 실현하고 시스템을 지속적으로 고도화해야 한다.
AI 요약 · 북마크 · 개인 피드 설정 — 무료