Claude와 Gemini를 활용한 나만의 Reddit 뉴스 팟캐스트 자동화 구축기

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

Claude와 Gemini, Kokoro TTS를 결합하여 Reddit의 주요 게시물을 요약하고 오디오 에피소드로 만들어 Apple Podcasts로 자동 전송하는 파이프라인 구축 사례이다.

배경

작성자가 출근길에 Reddit의 주요 소식을 듣기 위해 Claude를 활용하여 뉴스 브리핑 자동 생성 시스템을 구축하고 그 결과물과 기술 스택을 공유했다.

의미 / 영향

이 프로젝트는 LLM, 로컬 TTS, 가상 네트워킹 기술을 결합하여 개인화된 미디어 소비 환경을 구축하는 실무적 패턴을 제시했다. 특히 상용 서비스에 의존하지 않고도 고품질의 자동화된 콘텐츠 생성이 가능함을 입증했다.

커뮤니티 반응

작성자의 창의적인 파이프라인 구축에 대해 매우 긍정적인 반응이며, 특히 로컬 TTS와 보안 스트리밍 조합에 대한 관심이 높다.

주요 논점

01찬성다수

상용 서비스보다 개인화된 뉴스 큐레이션이 가능하며 비용이 거의 들지 않는 훌륭한 자동화 사례이다.

합의점 vs 논쟁점

합의점

Claude를 활용한 코드 생성과 Gemini의 저렴한 API 비용이 프로젝트의 실용성을 높였다.
Tailscale을 이용한 보안 접근 방식이 개인 프로젝트의 배포 문제를 깔끔하게 해결했다.

실용적 조언

TTS 발음이 어색할 경우 LLM 프롬프트에 'phonetic spellings'를 사용하도록 지시하여 개선할 수 있다.
Apple Podcasts 앱에서 직접 스트리밍하려면 서버가 반드시 Range request를 지원해야 한다.
macOS 사용자라면 launchd를 사용하여 특정 시간에 파이프라인이 실행되도록 자동화할 수 있다.

섹션별 상세

Reddit API와 LLM을 결합한 콘텐츠 큐레이션 워크플로를 구축했다. Python Reddit API wrapper를 통해 r/localLLaMA 등 지정된 서브레딧의 인기 게시물과 댓글을 수집한 뒤 Gemini 모델이 이를 Apple News 스타일의 스크립트로 변환한다. 수집된 방대한 데이터를 사람이 읽기 좋은 뉴스 형태로 재구성하는 것이 핵심이다.

로컬 TTS 엔진인 Kokoro ONNX를 활용하여 고품질 음성을 생성한다. Gemini가 작성한 스크립트를 Kokoro 모델이 음성으로 변환하며 ffmpeg를 사용하여 배경 음악과 음성을 믹싱한다. 특히 Claude가 작성한 페르소나 프롬프트를 통해 Kokoro가 발음하기 어려워하는 단어들을 음성 기호로 변환하여 자연스러움을 높였다.

Apple Podcasts 앱과의 호환성을 위해 맞춤형 HTTP 서버와 RSS 피드를 구현했다. Apple Podcasts의 탐색 기능을 지원하기 위해 Range request가 가능한 Python 기반 HTTP 서버를 구축하고 RSS 2.0 규격에 맞춰 피드를 생성한다. 이를 통해 사용자는 일반 팟캐스트 앱에서 자신이 만든 에피소드를 구독할 수 있다.

보안을 위해 Tailscale Serve를 활용하여 외부 노출 없이 스트리밍 환경을 조성했다. 서버를 공용 인터넷에 공개하는 대신 Tailscale의 개인 네트워크망을 통해 아이폰과 맥북을 연결함으로써 HTTPS 통신 보안을 유지하면서도 간편하게 접근할 수 있게 설계했다. 매일 오전 6시에 launchd가 파이프라인을 실행하여 자동화를 완성했다.

용어 해설

TTS: — Text-to-Speech의 약자로 텍스트를 인공적인 인간의 음성으로 변환하는 기술이다. 이 프로젝트에서는 Kokoro ONNX 모델을 사용하여 뉴스 브리핑 스크립트를 실제 오디오 파일로 생성하는 핵심 역할을 수행한다.
RSS Feed: — 웹사이트의 업데이트된 정보를 사용자에게 자동으로 전달하기 위한 데이터 규격이다. 여기서는 생성된 오디오 에피소드를 Apple Podcasts 앱이 인식하고 구독할 수 있도록 배포하는 통로로 사용된다.
Tailscale: — 기기 간에 보안 가상 사설망(VPN)을 구축해주는 서비스이다. 공용 인터넷에 서버를 노출하지 않고도 외부의 아이폰에서 맥북에 저장된 팟캐스트 파일을 안전하게 스트리밍할 수 있게 해준다.
ONNX: — 서로 다른 AI 프레임워크 간에 모델을 공유할 수 있도록 설계된 개방형 포맷이다. Kokoro 모델을 ONNX 런타임에서 실행함으로써 로컬 환경에서도 빠르고 효율적인 음성 합성이 가능해진다.

언급된 도구

Kokoro ONNX추천

로컬 환경에서의 고품질 텍스트 음성 변환(TTS)

Tailscale추천

개인 기기간 보안 네트워크 연결 및 스트리밍

Gemini-1.5-Flash추천

저비용 뉴스 스크립트 생성 및 요약

언급된 리소스

GitHubreddit-wire GitHub Repository