핵심 요약
텍스트 기반 비디오 생성은 영화 제작을 대중화했지만, 시네마틱 멀티샷(multi-shot) 시나리오에서의 카메라 제어는 여전히 큰 장벽으로 남아 있습니다. 암시적인 텍스트 프롬프트는 정밀도가 부족한 반면, 명시적인 궤적 조건화(trajectory conditioning)는 감당하기 힘든 수동 작업 비용을 초래하며 현재 모델들에서 실행 실패를 유발하는 경우가 많습니다. 이러한 병목 현상을 극복하기 위해, 본 논문은 정렬된 (캡션, 궤적, 비디오) 삼중항이 자동화된 구성(plotting)과 정밀한 실행을 연결할 수 있는 고유한 결합 분포를 형성한다는 데이터 중심의 패러다임 전환을 제안합니다. 이러한 통찰에 기반하여, 생성을 두 개의 협업 에이전트로 분리하는 '계획 후 제어(Plan-then-Control)' 프레임워크인 ShotVerse를 제시합니다. 이 프레임워크는 공간적 사전 지식을 활용하여 텍스트로부터 시네마틱하고 전역적으로 정렬된 궤적을 얻는 비전 언어 모델(VLM, Vision-Language Model) 기반의 플래너(Planner)와, 카메라 어댑터(camera adapter)를 통해 이러한 궤적을 멀티샷 비디오 콘텐츠로 렌더링하는 컨트롤러(Controller)로 구성됩니다. 우리 접근 방식의 핵심은 데이터 기반을 구축하는 데 있습니다. 우리는 분리된 단일 샷 궤적들을 하나의 통합된 전역 좌표계(global coordinate system)로 정렬하는 자동화된 멀티샷 카메라 보정(camera calibration) 파이프라인을 설계했습니다. 이는 우리 프레임워크의 근간이 되는 3트랙 평가 프로토콜을 갖춘 고충실도 시네마틱 데이터셋인 ShotVerse-Bench의 구축을 가능하게 했습니다. 광범위한 실험은 ShotVerse가 신뢰할 수 없는 텍스트 제어와 노동 집약적인 수동 구성 사이의 간극을 효과적으로 메우며, 우수한 시네마틱 미학을 달성하고 카메라 정확도와 샷 간 일관성(cross-shot consistency)을 모두 갖춘 멀티샷 비디오를 생성함을 보여줍니다.
핵심 기여
Plan-then-Control 프레임워크 제안
비디오 생성 과정을 VLM 기반의 경로 계획(Planner)과 카메라 어댑터 기반의 실행(Controller)으로 분리하여 복잡한 멀티샷 제어 문제를 해결함.
자동화된 멀티샷 카메라 보정 파이프라인
서로 다른 단일 샷들의 카메라 궤적을 하나의 전역 좌표계로 통합하여 정렬하는 기술을 개발하여 대규모 멀티샷 데이터 학습을 가능하게 함.
ShotVerse-Bench 데이터셋 구축
고충실도 시네마틱 영상과 정밀한 궤적 정보, 그리고 3가지 측면의 평가 프로토콜을 포함한 벤치마크를 제안하여 연구의 기준점을 마련함.
샷 간 일관성 및 시네마틱 미학 달성
전역 좌표계 기반의 궤적 정렬을 통해 여러 샷이 이어지는 상황에서도 시각적 일관성을 유지하며 전문 영화 수준의 카메라 연출을 구현함.
방법론
ShotVerse는 '계획 후 제어(Plan-then-Control)' 구조를 채택하여, 먼저 VLM 기반 플래너가 텍스트에서 시네마틱 궤적을 생성하고, 이후 컨트롤러가 카메라 어댑터를 통해 이를 비디오로 구현함. 특히 자동화된 카메라 보정 파이프라인을 통해 단일 샷 궤적들을 전역 좌표계(Global Coordinate System) 상에서 정렬하여 멀티샷 학습 데이터를 확보함.
주요 결과
ShotVerse는 기존의 텍스트 제어 방식 대비 월등한 카메라 제어 정확도를 보였으며, 수동 작업 없이도 높은 시네마틱 미학(Cinematic Aesthetics)을 달성함. ShotVerse-Bench를 통한 평가에서 카메라 궤적 일치도와 샷 간 일관성 측면에서 기존 모델들을 상회하는 성능을 기록함.
시사점
복잡한 카메라 연출이 필요한 고품질 영상 제작 공정을 자동화하여 제작 비용을 획기적으로 낮출 수 있음. 또한 전역 좌표계 기반의 정렬 방식은 향후 더 긴 호흡의 일관된 영상 생성 연구에 중요한 기초가 될 것임.
키워드
섹션별 상세
Plan-then-Control 프레임워크 제안
자동화된 멀티샷 카메라 보정 파이프라인
ShotVerse-Bench 데이터셋 구축
샷 간 일관성 및 시네마틱 미학 달성
AI 요약 · 북마크 · 개인 피드 설정 — 무료