본문으로 건너뛰기
오디오-비주얼 대형 언어 모델은 정말로 보고 듣는가? | AI Trends