본문으로 건너뛰기

vlm

시각 언어 모델

고급

이미지와 텍스트를 동시에 이해하고 처리할 수 있는 AI 모델이다. 문서의 시각적 구조를 직접 분석하여 텍스트와 레이아웃 정보를 한 번에 파악하는 데 활용된다.