직렬화 병목
모델이 답변을 생성(디코딩)하는 동안 새로운 영상 데이터의 입력을 중단해야 하는 구조적 한계다. 입출력이 순차적으로만 처리되어 실시간 스트리밍 영상의 흐름을 따라가지 못하고 지연 시간이 누적되는 원인이 된다.