본문으로 건너뛰기
Show-O 2: 단일 트랜스포머로 텍스트와 비디오를 통합하는 네이티브 멀티모달 모델 분석 | AI Trends