네이티브 멀티모달
모델 설계 단계부터 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 처리하도록 학습된 방식이다. 별도의 어댑터 없이도 여러 감각 정보를 통합적으로 이해하고 생성할 수 있어 데이터 간의 연관성 파악 능력이 뛰어나다.