멀티모달 생성 모델
텍스트, 이미지, 라이다 등 서로 다른 형태의 데이터를 동시에 이해하고 생성할 수 있는 모델로, 여기서는 카메라 영상과 라이다 데이터를 동시에 생성하는 데 쓰인다.