텍스트 기반 영상 생성
텍스트 설명을 입력받아 동영상을 생성하는 인공지능 기술이다. 딥러닝 모델이 텍스트의 맥락을 이해하고 시간에 따른 프레임 변화를 예측하여 시각화하며, 최근에는 물리 법칙과 질감을 사실적으로 표현하는 수준까지 발전했다.