Wav2Vec2
음성 인식을 위해 개발된 자기지도학습 기반의 AI 모델로, 음성 신호의 특징을 추출하여 텍스트와 매핑하는 능력이 탁월하다. Whisper보다 시간적 해상도가 높아 강제 정렬 작업에서 보조 모델로 널리 사용된다. 로컬 환경에서 정밀한 음성 분석과 타이밍 추출을 가능하게 하는 핵심 기술이다.