비전 언어 모델
이미지와 텍스트를 동시에 이해하고 처리할 수 있는 AI 모델이다. 이 기기에서는 카메라로 촬영된 식재료의 이미지를 분석하여 텍스트 형태의 레시피 데이터와 연결하는 핵심 역할을 수행한다.