통합 멀티모달 모델
텍스트, 이미지, 영상 등 다양한 형태의 데이터를 단일 아키텍처 내에서 동시에 처리하고 이해하며 생성하는 인공지능 구조입니다.
Sora를 넘어 AGI로: 세계 모델의 핵심 원칙과 CoW-Bench 공개