음성 대 음성 번역
말하는 사람의 음성을 실시간으로 인식하여 다른 언어의 음성으로 즉시 변환해 출력하는 기술이다. 음성 인식(STT), 기계 번역, 음성 합성(TTS) 과정을 거치며, 최근에는 이 단계를 통합한 엔드투엔드 모델 연구가 활발하다.