시공간 어텐션
영상 데이터의 공간적 정보(프레임 내 구조)와 시간적 정보(프레임 간 흐름)를 동시에 분석하여 일관성을 유지하는 메커니즘이다. 영상의 깜빡임이나 객체 변형을 방지하는 데 필수적이다.
영상과 소리를 동시에 생성한다? 바이트댄스 Seedance 2.0의 혁신