stt
음성 신호를 텍스트 데이터로 변환하는 기술로, Whisper와 같은 모델이 대표적이며 AI 앱의 입력 단계에서 필수적인 역할을 수행한다.
나만의 '자비스' 만들기: 로컬 홈 AI 에이전트 구축을 위한 최적의 프레임워크는?
클로드 지능은 만족하지만 음성 인식은 실망? 사용자의 해결법
Whisper 전사 품질과 속도 사이의 최적점은 60초 청크?
AMD 그래픽카드로 구현한 딜레이 없는 고성능 로컬 음성 비서
클라우드 없이 구현하는 OpenClaw 로컬 음성 에이전트