시간적 정렬
비디오의 시각적 프레임과 오디오 신호를 동일한 시간축에서 일치시켜 분석하는 기법이다. 특정 단어를 말할 때의 미세한 시선 회피나 멈춤을 정확히 연결하여 행동 패턴을 이해하는 데 중요하다.