나의 첫 번째 실전 워크플로우! Multi-LLM 프롬프팅과 Union ControlNet을 활용한 Z-Image-Turbo 의사 에디터

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

ComfyUI 기반으로 로컬 비전 LLM과 프롬프트 재작성 LLM, Union ControlNet을 통합하여 사진을 편집하는 Z-Image-Turbo 워크플로우이다.

사용자가 ComfyUI를 활용해 구축한 복합적인 이미지 편집 워크플로우를 공유했다. Z-Image-Turbo 모델을 핵심으로 하며, 여러 LLM과 ControlNet을 조합해 자동화된 편집 환경을 구현했다.

사용자가 직접 제작한 복잡하고 정교한 워크플로우에 대해 긍정적인 반응이 나타났다. 특히 LLM을 활용한 자동 프롬프트 생성과 깔끔한 대시보드 구성이 주목받았다.

워크플로우의 핵심은 로컬 비전 LLM을 활용한 이미지 분석 단계이다. 입력된 원본 사진을 비전 모델이 분석하여 텍스트 묘사를 생성하고, 이를 다시 두 번째 LLM이 프롬프트 형식으로 재작성하여 이미지 생성 모델에 전달하는 구조를 갖췄다.

Union ControlNet을 지원하여 사용자가 이미지의 구조를 유지하면서 스타일이나 내용을 변경할 수 있도록 설계됐다. Canny, Depth, Pose 등 다양한 제어 방식을 선택적으로 적용할 수 있는 유연성을 확보했다.

사용자 편의를 위해 커스텀 UI 대시보드를 구축했다. 복잡한 노드 연결을 직접 다루지 않고도 토글 컨트롤, 매뉴얼 사이즈 조절, 시드 제어 등을 한곳에서 관리할 수 있는 컴팩트한 인터페이스를 제공한다.

이미지의 가로세로 비율(Aspect Ratio)을 자동으로 감지하는 기능이 포함되어 있다. 원본 이미지의 규격에 맞춰 생성 모델의 설정을 자동으로 조정함으로써 수동 설정의 번거로움을 줄이고 작업 효율을 높였다.

ComfyUI추천

노드 기반 이미지 생성 워크플로우 설계

Z-Image-Turbo추천

고속 이미지 생성 및 편집 모델

ControlNet추천

이미지 구조 및 구도 제어