3D 시각적 접지
자연어 설명을 입력받아 3D 장면 내에서 해당 설명에 부합하는 특정 물체의 위치를 식별하고 경계 상자(Bounding Box)를 생성하는 기술이다. 로봇이 주변 환경을 이해하고 인간의 명령을 수행하기 위한 핵심적인 인지 능력으로 꼽힌다.