옴니 컨디셔닝
비디오 생성 모델에서 텍스트 외에 이미지, 비디오 등 다양한 형태의 조건을 동시에 입력받아 제어하는 기법이다. 이를 통해 단순 텍스트 기반 생성을 넘어 특정 이미지의 스타일이나 비디오의 움직임을 결과물에 반영할 수 있다. 멀티모달 입력의 일관성을 유지하는 데 핵심적인 역할을 한다.