위스퍼 라지 v3
OpenAI에서 개발하여 오픈소스로 공개한 최신 음성 인식 모델이다. 다국어 지원이 강력하며 배경 소음이 있는 환경에서도 높은 전사 정확도를 보여준다. 많은 AI 서비스들이 기본 STT 엔진으로 채택하고 있는 표준적인 모델이다.
클로드 음성 인식, 챗GPT보다 뒤처진 이유와 해결책은?