비디오 희소 어텐션
비디오 데이터의 방대한 토큰 중 중요한 영역에만 선택적으로 주의(Attention)를 기울이는 기법입니다. 전체 토큰 간의 관계를 모두 계산하는 대신 핵심적인 공간-시간 큐브에 집중함으로써 연산량을 획기적으로 줄여 고해상도 처리를 가능하게 합니다.