본문으로 건너뛰기
qwen3-vl
Qwen3-VL
중급
Qwen3-VL은 텍스트와 이미지의 멀티모달 정보를 함께 인코딩하는 조건 인코더로, 본 논문에서 텍스트-이미지 입력의 공통 표현을 추출하는 핵심 모듈이다.
비슷한 개념
qwen-image-2-0
multi-modal-model
mmproj
condition-encoder
msrope
ViT-embeddings
lvm
vision-encoder
← 용어 사전 전체 보기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지