음성 임베딩 (voice-embedding) | AI Trends 용어 사전 | AI Trends
voice-embedding
음성 임베딩
중급
음성 데이터를 고차원 벡터 공간의 점으로 변환하여 목소리의 특징을 수치화하는 기술이다. 1024차원 이상의 벡터를 통해 목소리의 톤, 피치, 억양 등을 정밀하게 표현하며, 이를 통해 복잡한 오디오 신호를 수학적으로 처리 가능한 형태로 바꾼다. 음성 인식 및 합성 시스템의 효율성을 높이는 핵심 요소이다.