비전 분석
이미지 데이터를 입력받아 그 안의 객체, 텍스트, 차트 수치 등을 해석하는 기술로, 멀티모달 모델을 통해 시각적 정보를 텍스트로 변환하는 데 사용된다.
단순 챗봇을 넘어선 '맥가이버' 연구 에이전트 만들기