음성 활동 감지
입력된 오디오 신호에서 인간의 음성이 포함된 구간을 실시간으로 찾아내는 기술이다. 이 게시물에서는 정수 연산만으로 구현되어 에지 환경에서의 효율성을 극대화했다.
Ollama보다 빠른 Vulkan 성능? Go로 구현한 고성능 LLM 추론 엔진 dlgo
아무도 말 안 하는데 Whisper가 '구독 좋아요'를 외치는 이유
지연 시간의 벽을 허물다: OpenAI Realtime API로 구현하는 끊김 없는 음성 AI
L1 캐시에 들어가는 초경량 정수 신경망으로 구현한 자율 학습 NPC