구글, 고성능 이미지 생성 및 편집 모델 '나노 바나나 2(Gemini 3.1 Flash Image)' 공개

핵심 요약

구글이 고해상도 이미지 생성과 빠른 편집 기능을 결합한 '나노 바나나 2(Gemini 3.1 Flash Image)' 모델을 발표했다. 이 모델은 제미나이(Gemini)의 광범위한 세계 지식을 활용하여 실사 기반의 이미지를 생성하며, 특히 텍스트 렌더링과 다국어 로컬라이제이션 성능이 크게 향상되었다. 개발자는 구글 AI 스튜디오(Google AI Studio)와 제미나이 API를 통해 다양한 화면 비율과 해상도 옵션을 설정할 수 있으며, '생각 수준(Thinking levels)' 조절을 통해 복잡한 프롬프트에 대한 추론 성능을 최적화할 수 있다. 현재 유료 API 키를 통해 즉시 사용 가능하며 버텍스 AI(Vertex AI)와 파이어베이스(Firebase) 등 주요 플랫폼에 통합되었다.

배경

Google AI Studio 사용법, Gemini API 기초, 이미지 생성 프롬프트 엔지니어링

대상 독자

이미지 생성 기반 앱 개발자 및 생성형 AI 워크플로를 구축하는 엔지니어

의미 / 영향

이미지 생성 모델의 비용 효율성과 속도를 개선하면서도 텍스트 렌더링과 같은 고난도 작업을 해결하여, 상업용 광고 및 UI 자동 생성 분야에서 AI 활용도가 크게 높아질 것이다. 특히 추론 단계 제어 기능은 개발자들에게 더 세밀한 품질 관리 수단을 제공한다.

섹션별 상세

나노 바나나 2는 제미나이 모델의 방대한 지식을 바탕으로 웹 검색 이미지에서 영감을 얻은 정교한 시각적 결과물을 생성한다. 'Window Seat' 앱 사례처럼 실시간 기상 데이터나 특정 지역의 특성을 반영한 사실적인 풍경을 구현하는 데 탁월한 성능을 보인다. 이는 단순한 이미지 생성을 넘어 실제 세상의 맥락을 이해하고 시각화하는 능력이 강화되었음을 의미한다.

이미지 내 텍스트 렌더링 성능이 이전 플래시(Flash) 모델 대비 대폭 업그레이드되어 정밀하고 선명한 글자 표현이 가능하다. 특히 인-이미지 로컬라이제이션(In-image localization) 기능을 지원하여 이미지 내의 텍스트를 여러 언어로 직접 번역하거나 생성할 수 있다. 'Global Ad Localizer' 데모를 통해 광고 이미지를 각국 언어에 맞춰 시각적 요소와 텍스트를 동시에 현지화하는 능력을 입증했다.

개발자에게 더 높은 창의적 제어권을 제공하기 위해 다양한 기술적 옵션이 추가되었다. 기존 화면 비율 외에 4:1, 1:4, 8:1, 1:8 등 특수 비율을 지원하며, 빠른 반복 작업과 대량 처리를 위해 새로운 512px 해상도 티어를 도입했다. 또한 복잡하고 다층적인 프롬프트에 대한 지시 이행 능력이 강화되어 개발자가 의도한 결과물을 더 정확하게 얻을 수 있다.

모델의 추론 과정을 제어할 수 있는 '구성 가능한 생각 수준(Configurable thinking levels)' 기능이 도입되었다. 기본값인 '최소(Minimal)'와 '높음/동적(High/Dynamic)' 중 선택하여 모델이 이미지를 렌더링하기 전에 복잡한 프롬프트를 논리적으로 검토하게 할 수 있다. 이를 통해 프롬프트 준수율을 높이고 최종 출력물의 품질을 획기적으로 개선할 수 있는 유연성을 제공한다.

이미지 분석

Screenshot
텍스트-이미지 생성 성능에 대한 벤치마크 지표를 시각화하여 나노 바나나 2 모델의 기술적 우위를 수치적으로 뒷받침한다. 모델의 텍스트 렌더링 및 정밀도를 타 모델과 비교하는 근거 자료로 활용된다.
Gemini 모델의 이미지 생성 벤치마크 결과를 보여주는 스크린샷이다.

실무 Takeaway

Gemini API 및 Google AI Studio를 통해 512px부터 4K까지 다양한 해상도와 특수 화면 비율(8:1 등)을 프로젝트 요구사항에 맞춰 선택 가능하다.
이미지 내 텍스트 번역 및 렌더링 기능이 강화되어 글로벌 마케팅 에셋 제작 시 시각적 일관성을 유지하며 현지화 작업을 자동화할 수 있다.
복잡한 프롬프트 처리가 필요한 경우 'Thinking levels'를 높게 설정하여 모델의 추론 시간을 늘리고 출력 품질과 지시 이행도를 최적화할 수 있다.

언급된 리소스

API DocsGemini API Developer Docs

DemoGoogle AI Studio App Gallery