오디오 모달리티
AI 모델이 텍스트나 이미지 외에 음성 및 소리 데이터를 처리하고 이해하는 능력이다. 멀티모달 학습을 통해 언어 모델이 오디오 정보를 직접 해석하거나 생성할 수 있게 한다.