핵심 요약
자율주행 산업이 단순 객체 인식을 넘어 센서 입력을 제어로 직접 연결하는 엔드투엔드 모델로 진화함에 따라, 무엇이 있는지보다 왜 특정 행동을 해야 하는지에 대한 인과적 이해가 중요해졌다. Kognic은 이를 위해 텍스트 기반의 장면 설명과 추론 과정을 데이터화하는 언어 그라운딩 기능을 플랫폼에 추가했다. 이 기능은 작성, 편집, 순위 지정의 세 가지 모드와 사후 확증 편향을 방지하는 인과 관계 체인 워크플로우를 제공한다. 이를 통해 자율주행 모델의 계획 정확도를 12% 향상시키고 시뮬레이션 내 위험 상황 발생률을 35% 줄이는 성과를 거두었다.
배경
자율주행 인지 및 판단 시스템 기초, 데이터 어노테이션 개념, RLHF(인간 피드백 기반 강화학습)에 대한 이해
대상 독자
자율주행 엔드투엔드 모델 개발자 및 AI 데이터 전략가
의미 / 영향
자율주행 기술이 단순한 시각 지능을 넘어 언어와 논리를 결합한 추론 지능 단계로 진입하고 있음을 시사한다. 이는 테슬라 FSD와 같은 엔드투엔드 아키텍처의 성능을 고도화하는 데 핵심적인 역할을 할 것으로 보인다.
섹션별 상세
이미지 분석

작업자가 특정 주행 상황에서 차량이 왜 그런 결정을 내려야 하는지 논리적 추론 과정을 직접 텍스트로 입력하는 화면을 보여준다. 왼쪽 패널에는 결정 사항과 추론 근거를 작성하는 칸이 있으며, 중앙에는 카메라 뷰가 배치되어 있다.
언어 그라운딩의 작성(Write) 모드 인터페이스 스크린샷이다.

AI 모델이 생성한 장면 설명을 인간 전문가가 검토하고 수정하는 과정을 보여준다. 특정 객체(파란 셔츠를 입은 사람)에 대한 설명을 정교화하여 모델의 정확도와 안전성을 높이는 워크플로우를 시각화한다.
모델이 생성한 캡션을 수정하는 편집(Edit) 모드 화면이다.

동일한 장면에 대해 생성된 여러 텍스트 옵션 중 가장 정확한 것을 작업자가 선택하는 화면이다. 이는 자율주행 모델을 위한 RLHF 과정의 핵심적인 데이터 수집 단계를 나타낸다.
여러 모델 출력값 중 최적을 선택하는 순위 지정(Rank) 모드이다.
실무 Takeaway
- 자율주행 모델 학습 시 객체 라벨링을 넘어 왜(Why)에 대한 텍스트 기반 추론 데이터를 결합해야 성능 임계치를 돌파할 수 있다.
- 어노테이션 시 작업자가 미래 상황을 알고 작성하는 편향을 막기 위해 결정 시점의 정보만 제한적으로 제공하는 워크플로우 설계가 필수적이다.
- 자율주행 분야에서도 LLM의 RLHF 기법을 응용하여 주행 행동의 우선순위를 학습시키는 방식이 유효한 전략으로 부상하고 있다.
AI 요약 · 북마크 · 개인 피드 설정 — 무료