Transformers v5.12.0 릴리즈를 통해 MiniMax-M3-VL, PP-OCRv6, Parakeet-RNNT 모델이 추가되었으며, 다수의 버그 수정 및 CI 보안 강화가 포함되었습니다.
로컬 디렉토리에서 custom_generate를 실행할 때 trust_remote_code 설정이 필수적으로 요구됩니다.
custom_generate 호출 시 trust_remote_code=True를 명시하여 실행해야 합니다.
MiniMax-M3-VL 모델 추가
CLIP 스타일 비전 타워와 3D RoPE, 혼합 밀집/희소 MoE 디코더를 결합한 비전-언어 모델입니다.
PP-OCRv6 모델 추가
MetaFormer 스타일 빌딩 블록을 사용한 경량 OCR 시스템으로, 서버부터 엣지까지 다양한 배포 환경을 지원합니다.
Parakeet-RNNT 모델 추가
Fast Conformer 인코더와 RNN-T 디코더를 결합하여 언어 컨텍스트를 유지하는 음성 인식 모델입니다.
아직 관련 토론이 없습니다.
댓글을 작성하려면 로그인이 필요합니다.