비전 거대언어모델
텍스트뿐만 아니라 이미지를 입력받아 그 내용을 이해하고 분석할 수 있는 인공지능 모델이다. 이미지 속 객체, 구도, 분위기 등을 텍스트로 설명하는 능력을 갖추고 있다.
P&ID 도면 분석도 척척, 로컬 LLM으로 산업용 문서 자동화하기
ComfyUI와 LLM의 결합, 사진 편집을 위한 지능형 대시보드 워크플로우