자동 음성 인식
사람의 음성 신호를 컴퓨터가 이해할 수 있는 텍스트 데이터로 변환하는 기술로, 음성 비서나 자막 생성 등에 널리 사용된다.
Whisper를 넘어서는 성능? IBM, 알리바바, 미스트랄의 차세대 ASR 모델 비교
구형 Tesla P40의 부활: vLLM 개조로 실시간 음성 인식 성공
IBM의 1B 음성 모델, 더 작고 빠르며 다국어까지 완벽 지원
M2 Max에서 RTF 0.06 달성, Apple Silicon 전용 오픈소스 음성 AI 툴킷
5년의 기다림 끝에 1억 6천만 달러 투자 유치, 음성 AI 인프라의 정점 AssemblyAI