prosody
언어의 리듬, 강세, 억양 등 음성적 특징을 말한다. 단순히 단어를 읽는 것을 넘어 문맥과 감정에 따라 소리의 높낮이와 속도를 조절함으로써 음성의 자연스러움과 전달력을 결정하는 핵심 요소이다.
시의 감성을 담는 TTS: 우르두어 낭독을 위한 커스텀 모델 구축기
AI인 걸 들키지 않는 5초의 승부, ElevenLabs vs Azure 실전 비교
외국어 섞어 써도 자연스럽다? Together AI의 새로운 음성 합성 모델
지연 시간 0.25초 미만! 사람처럼 말하는 MiniMax AI 음성 모델 등장