vision-model
텍스트뿐만 아니라 이미지나 PDF 같은 시각적 데이터를 이해하고 처리할 수 있는 AI 모델이다. 멀티모달 인터페이스를 구현하는 데 필수적인 요소이다.
Gemma 3와 Nemotron의 만남? 로컬 비전 AI 구축을 위한 기술적 상상력