본문으로 건너뛰기

qwen3-vl

Qwen3-VL

중급

Qwen3-VL은 텍스트와 이미지의 멀티모달 정보를 함께 인코딩하는 조건 인코더로, 본 논문에서 텍스트-이미지 입력의 공통 표현을 추출하는 핵심 모듈이다.