알리바바, 대화형 픽셀 편집과 스토리보드 생성을 지원하는 Wan 2.7-Image 출시

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

알리바바 통의 연구소(Tongyi Lab)에서 고해상도 시각적 생성을 위한 파운데이션 모델인 Wan 2.7-Image를 출시했다. 이 모델은 단순한 이미지 생성을 넘어 사용자가 이미지 내 객체를 이동하거나 크기를 조절하고 텍스트를 수정할 수 있는 픽셀 수준의 대화형 편집 기능을 제공한다. 또한 단일 프롬프트로부터 최대 12장의 일관성 있는 연속 이미지를 생성하여 스토리보드 제작 효율을 극대화한다. 현재 웹 서비스와 API 형태로 제공되어 개발자와 일반 사용자 모두 접근 가능하다.

대상 독자

AI 이미지 생성 도구를 활용하는 크리에이티브 디자이너 및 개발자

의미 / 영향

알리바바의 이번 출시는 단순 생성에서 정밀 편집으로 이미지 AI의 패러다임이 변화하고 있음을 보여준다. 특히 스토리보드 생성 기능은 콘텐츠 제작 파이프라인에서 일관성 문제를 해결하는 중요한 이정표가 될 것이다.

섹션별 상세

기존 이미지 생성 모델은 생성 후 미세 조정이 어렵다는 한계가 있었다. Wan 2.7-Image는 픽셀 수준의 대화형 편집 기능을 도입하여 이미지 내 객체의 위치 이동, 크기 조정, 텍스트 수정을 직접 수행할 수 있게 한다. 이를 통해 사용자는 생성된 결과물을 별도의 외부 도구 없이도 원하는 형태로 정밀하게 제어한다.

Wan 2.7-Image 모델로 생성된 다양한 인물들의 갤러리 이미지이다. — Screenshot모델이 생성한 인물들의 피부 질감, 머리카락, 표정 등이 매우 사실적임을 보여준다. 이는 Wan 2.7-Image가 고해상도 인물 생성에서 높은 성능을 보유하고 있음을 시각적으로 증명한다.

여러 장의 이미지를 생성할 때 캐릭터나 배경의 일관성을 유지하는 것은 어려운 과제였다. 이 모델은 단일 프롬프트를 기반으로 최대 12장의 고도로 일관된 순차적 이미지를 생성하는 기능을 갖추고 있다. 웹툰이나 애니메이션 스토리보드 제작 시 시각적 연속성을 보장하여 작업 시간을 단축시킨다.

고품질 시각적 결과물을 다양한 환경에서 활용할 수 있도록 접근성을 높였다. Wan 2.7-Image는 웹 인터페이스뿐만 아니라 API를 통해서도 제공되어 기존 워크플로우나 애플리케이션에 쉽게 통합할 수 있다. 무료 옵션을 포함하여 사용자가 기술을 직접 체험하고 상용 서비스에 적용할 수 있는 경로를 제공한다.

Wan 2.7-Image의 주요 기능과 특징을 나열한 인포그래픽이다. — Infographic픽셀 수준의 편집, 스토리보드 생성, API 지원 등 모델의 핵심 기능을 요약하여 보여준다. 사용자가 이 모델을 통해 얻을 수 있는 실질적인 가치를 한눈에 파악할 수 있게 돕는다.

이미지 분석

Diagram
Wan 모델의 기술적 기반이 되는 Transformer 구조를 시각화하여 입력 임베딩부터 멀티헤드 셀프 어텐션 과정을 설명한다. 모델의 작동 원리를 이해하는 데 필요한 핵심적인 기술 정보를 제공한다.
Transformer 아키텍처와 Attention 메커니즘을 설명하는 상세 다이어그램이다.

실무 Takeaway

이미지 내 특정 객체를 선택해 이동하거나 크기를 바꾸는 픽셀 단위 편집 기능을 활용해 생성 AI의 제어력을 높일 수 있다.
단일 프롬프트로 12장의 일관된 이미지를 생성하는 기능을 통해 스토리보드나 연작 콘텐츠 제작의 생산성을 개선한다.
API 지원을 통해 기업이나 개발자가 자신의 서비스 내에 알리바바의 고성능 이미지 생성 및 편집 기능을 직접 통합할 수 있다.

언급된 리소스

DemoWan 2.7-Image Website