비전 거대언어모델
텍스트뿐만 아니라 이미지를 입력받아 그 내용을 이해하고 분석할 수 있는 인공지능 모델이다. 이미지 속 객체, 구도, 분위기 등을 텍스트로 설명하는 능력을 갖추고 있다.