멀티모달 추론
텍스트뿐만 아니라 이미지, 오디오 등 다양한 형태의 데이터를 동시에 처리하고 논리적으로 분석하는 능력이다. 소형 모델이 멀티모달 추론을 지원하면 로컬 기기에서 시각적 정보 분석이나 음성 명령 처리를 서버 연결 없이 고속으로 수행할 수 있다.