핵심 요약
deck2video는 마크다운 기반 슬라이드 제작 도구인 Marp와 Slidev를 활용하여 나레이션이 포함된 발표 영상을 자동으로 생성하는 오픈소스 프로젝트이다. 사용자가 슬라이드 내 HTML 주석으로 스피커 노트를 작성하면, Chatterbox TTS 엔진이 이를 음성으로 변환하고 슬라이드 이미지와 결합하여 비디오를 제작한다. 특히 사용자의 목소리 샘플을 통한 보이스 클로닝 기능을 지원하여 개인화된 나레이션을 입힐 수 있는 것이 특징이다. 전체 프로세스는 포맷 감지, 렌더링, 음성 합성, 비디오 조립의 4단계로 구성되며 CLI를 통해 간편하게 실행 가능하다.
배경
Python 3.11, Node.js 및 npm, ffmpeg, Marp 또는 Slidev CLI
대상 독자
마크다운으로 발표 자료를 관리하며 자동화된 나레이션 영상 제작이 필요한 개발자 및 기술 교육자
의미 / 영향
이 도구는 기술 문서나 발표 자료를 영상 콘텐츠로 전환하는 비용을 획기적으로 낮춘다. 특히 목소리 복제 기술을 결합하여 개인화된 교육 영상을 대량으로 자동 생성할 수 있는 가능성을 제시하며, 마크다운 기반의 워크플로우를 영상 제작 영역까지 확장시킨다.
섹션별 상세
python -m deck2video presentation.md --voice voice-sample.wav목소리 복제용 샘플 파일을 사용하여 마크다운 슬라이드를 비디오로 변환하는 기본 명령어

{
"kubectl": "cube control",
"nginx": "engine X",
"PostgreSQL": "post gress Q L",
"Kubernetes": "koo ber net eez"
}기술 용어의 정확한 발음을 위해 제공하는 발음 재정의 JSON 파일 예시
---
marp: true
---
# Welcome
<!-- 안녕하세요, 발표를 시작합니다. -->
---
# Architecture
<!-- video: demo.mp4 -->
<!-- 시스템 아키텍처를 설명하는 데모 영상입니다. -->스피커 노트와 비디오 삽입 지시어가 포함된 마크다운 슬라이드 작성 예시
실무 Takeaway
- 마크다운 슬라이드에 HTML 주석으로 대본을 추가하고 deck2video를 실행하면 별도의 녹음 장비 없이도 전문적인 발표 영상을 제작할 수 있다.
- voice 파라미터에 본인의 짧은 음성 샘플을 입력하여 AI가 본인의 목소리로 나레이션을 수행하도록 설정함으로써 콘텐츠의 일관성을 유지할 수 있다.
- 기술 용어 발음이 어색할 경우 pronunciations.json 파일을 생성하여 'kubectl'을 'cube control'로 읽도록 지정하는 방식으로 TTS 품질을 세밀하게 조정 가능하다.
언급된 리소스
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.