핵심 요약
발표 영상을 제작하는 과정은 슬라이드 디자인, 녹음, 영상 편집 등 많은 수작업을 요구한다. deck2video는 Marp나 Slidev로 작성된 마크다운 문서를 입력받아 이 과정을 자동화한다. 사용자가 HTML 주석으로 작성한 발표자 노트를 Chatterbox 엔진을 통해 음성으로 합성하며, 단일 목소리 샘플을 활용한 목소리 복제 기능도 지원한다. 최종적으로 렌더링된 슬라이드 이미지와 합성된 음성을 ffmpeg을 통해 결합하여 완성된 MP4 파일을 생성한다.
배경
Python 3.11, Node.js 및 npm, ffmpeg, 마크다운(Marp/Slidev) 작성 지식
대상 독자
기술 발표 영상을 자주 제작하는 개발자, 온라인 강의 제작자, 오픈소스 프로젝트 메인테이너
의미 / 영향
이 도구는 비디오 제작을 '코드로서의 문서(Documentation as Code)' 영역으로 확장한다. 마크다운 수정만으로 영상을 업데이트할 수 있어, 제품 업데이트가 잦은 기술 문서나 튜토리얼 영상의 유지보수 비용을 획기적으로 낮출 수 있다.
섹션별 상세
마크다운 기반의 슬라이드 워크플로우를 지원한다. Marp와 Slidev 형식을 자동으로 감지하며, 각 슬라이드 구분자 사이에 위치한 HTML 주석을 내레이션 텍스트로 추출한다. 내레이션이 없는 슬라이드는 지정된 시간 동안 정지 화면으로 유지되는 기능을 갖추고 있다.
AI 기반의 음성 합성 및 목소리 복제 기능을 제공한다. Chatterbox 엔진을 사용하여 텍스트를 음성으로 변환하며, --voice 옵션에 단일 WAV 파일을 지정하는 것만으로 특정 인물의 목소리를 복제하여 내레이션에 적용한다. 다국어 TTS를 위한 언어 코드 설정과 음성 생성 파라미터 조절 기능도 포함되어 있다.
효율적인 영상 수정과 검토를 위한 인터랙티브 모드를 지원한다. --interactive 플래그를 사용하면 각 슬라이드의 음성이 생성될 때마다 즉시 확인하고, 마음에 들지 않을 경우 해당 슬라이드만 다시 생성하거나 전체 과정을 중단할 수 있다. 이는 전체 렌더링이 끝날 때까지 기다리지 않고도 품질을 관리할 수 있게 한다.
기술 용어 발음 교정 및 스크린캐스트 통합 기능을 갖추고 있다. JSON 파일을 통해 kubectl이나 PostgreSQL 같은 전문 용어의 발음을 지정할 수 있으며, 정적 슬라이드 대신 실제 시연 영상 파일을 삽입하여 내레이션과 결합하는 것도 가능하다. 특정 슬라이드만 선택적으로 재합성하는 기능을 통해 수정 작업의 효율성을 높였다.
</> 코드 예제 포함
실무 Takeaway
- 마크다운 문서 하나로 슬라이드 렌더링부터 음성 더빙까지 비디오 제작 전 과정을 자동화하여 생산성을 극대화한다.
- 목소리 복제 기술을 활용해 전문 성우 없이도 본인의 목소리로 자연스러운 내레이션을 생성할 수 있다.
- 발음 사전(Pronunciation Overrides) 기능을 통해 AI가 틀리기 쉬운 기술 용어의 정확도를 수동으로 보정 가능하다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료