온디맨드 컨텍스트 구축
비디오 전체 프레임을 모델에 한꺼번에 입력하는 대신, 모델이 추론 과정에서 필요한 특정 시점의 프레임만 Python 코드로 호출하여 시각적 정보를 가져오는 방식이다. 이를 통해 컨텍스트 윈도우의 부담을 줄이고 연산 효율성을 극대화할 수 있다.