이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.
핵심 요약
기존 Circle to Search는 단일 객체 검색에 집중했으나, 복합적인 시각적 질문을 해결하는 데 한계가 있었다. Google은 Gemini 3를 도입하여 이미지 내 여러 객체를 동시에 인식하고 그 관계를 분석하는 기능을 추가했다. 이 시스템은 에이전트 기반 계획을 통해 이미지를 분할하고 다중 검색을 수행한 뒤 결과를 종합하여 사용자에게 제공한다. 이번 업데이트는 삼성 Galaxy S26 및 Pixel 10 시리즈를 시작으로 점차 확대될 예정이다.
배경
Circle to Search 기본 사용법, LLM 에이전트 및 추론의 기본 개념, 멀티모달 AI의 작동 원리
대상 독자
Android 기기 사용자 및 모바일 AI 기술에 관심 있는 개발자
의미 / 영향
검색 엔진이 단순 키워드 매칭에서 에이전트 기반의 종합 분석 도구로 진화하고 있음을 시사한다. 특히 Gemini 3와 같은 최신 LLM이 모바일 OS의 핵심 기능에 깊숙이 통합되면서 사용자 경험의 질적 변화를 이끌어낼 것으로 보인다.
섹션별 상세
Gemini 3의 에이전트 능력을 활용한 다중 객체 검색 기능을 도입했다. Gemini 3 모델의 에이전트 계획(Agentic Planning)과 추론 기능을 통해 사용자가 이미지 내 여러 항목을 한꺼번에 선택해도 각 요소를 개별적으로 인식하고 분석한다.
시각적 쿼리 팬아웃(Visual Query Fan-out) 기술을 고도화했다. 단일 매칭을 넘어 모델이 다단계 계획을 수립하여 이미지의 중요 부분을 자동 크롭하고, 여러 검색을 동시에 실행한 후 결과를 교차 참조하여 최종 응답을 생성한다.
패션 및 생태계 분석 등 실용적 활용 사례를 제시했다. 사용자가 소셜 미디어의 착장 사진을 선택하면 상의, 하의, 액세서리를 각각 식별하여 유사 제품을 찾아주며, 여러 종류의 물고기가 담긴 사진에서는 각 종의 이름과 생태적 관계까지 설명한다.
가상 시착(Virtual Try-on) 기능과 Circle to Search를 통합했다. 검색 결과에서 바로 가상 드레스룸으로 진입하여 선택한 의류가 다양한 체형의 모델이나 사용자 자신에게 어떻게 어울리는지 확인할 수 있는 기능을 지원한다.

실무 Takeaway
- Gemini 3의 에이전트 아키텍처를 적용하여 단순 검색을 넘어선 복합적 추론 기반의 시각 정보 처리가 가능해졌다.
- 멀티모달 모델이 검색 쿼리를 스스로 분화(Fan-out)하고 결과를 종합하는 방식은 향후 AI 에이전트의 표준 작동 모델이 될 가능성이 높다.
- 이커머스 분야에서 다중 객체 인식과 가상 시착의 결합은 사용자 구매 여정을 단축시키는 강력한 도구로 작용한다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
원문 발행 2026. 02. 26.수집 2026. 02. 26.출처 타입 RSS
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.