디퓨전 트랜스포머
이미지나 비디오 생성에 쓰이는 디퓨전 모델의 구조에 트랜스포머 아키텍처를 결합한 형태이다. 대규모 데이터 학습에 유리하며, 고해상도 콘텐츠 생성이나 복잡한 궤적 예측에서 뛰어난 성능을 발휘한다.
AI 이미지의 결함을 스스로 학습하는 10만 장의 ArtiAgent 데이터셋 공개
VLA 모델 메모리 70% 절감, 성능은 원본 초과? QuantVLA의 혁신
머리 움직임과 손가락 관절까지 실시간 반영하는 생성형 XR 기술
다중 인물 오디오-비디오 생성의 혁신, DreamID-Omni로 정교한 제어 실현
AI 실험은 끝났다, 이제는 워크플로우 혁신과 수익화의 시대