음성 합성
텍스트나 악보 데이터를 기반으로 인공적인 인간의 목소리를 생성하는 기술이다. 딥러닝 모델이 성대의 떨림, 발음, 음의 높낮이를 학습하여 자연스러운 목소리를 출력하며, 최근에는 가창 합성(Singing Synthesis) 분야로 확장되고 있다.