적응형 초당 프레임 수
사용자의 질문 의도에 따라 비디오에서 추출하는 이미지 프레임의 빈도를 동적으로 조절하는 기술이다. 요약 시에는 낮은 FPS를, 특정 시점의 세부 분석 시에는 높은 FPS를 사용하여 토큰 효율성과 분석 정확도 사이의 균형을 맞춘다.