시청각 지능
시각적 정보와 청각적 정보를 동시에 처리하고 이해하며 생성하는 AI 기술이다. 두 양식 간의 시간적 동기화와 인과 관계를 학습하여 실제 세계와 유사한 멀티모달 상호작용을 가능하게 하는 핵심 분야이다.