이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.
핵심 요약
WebMCP는 웹사이트가 AI 에이전트에게 직접 구조화된 도구를 제공하게 함으로써 스크래핑의 한계를 극복한다. 이는 토큰 비용을 절감하고 에이전트의 동작 정확도를 획기적으로 높이는 브라우저 수준의 새로운 표준이다.
배경
현재 AI 에이전트는 웹사이트를 이용할 때 HTML 스크래핑이나 스크린샷 분석에 의존하여 비용과 오류 문제가 발생한다.
대상 독자
AI 에이전트 개발자, 웹 개발자, 브라우저 기술에 관심 있는 엔지니어
의미 / 영향
웹사이트 구축 패러다임이 인간 사용자뿐만 아니라 AI 에이전트를 위한 인터페이스 제공으로 확장된다. 이는 에이전트의 웹 제어 정확도를 높이고 복잡한 웹 기반 업무 자동화의 신뢰성을 보장하는 기반이 된다.
챕터별 상세
00:00
웹 에이전트의 한계와 스크래핑의 고통
현재 AI 에이전트가 웹사이트를 방문하는 방식은 해당 사이트의 언어를 모르는 관광객과 유사하다. LangChain이나 Claude Code와 같은 도구들은 HTML을 스크래핑하거나 수많은 스크린샷을 찍어 멀티모달 모델에 전달하는 방식을 사용한다. 이 과정에서 막대한 양의 토큰이 소모되며 에이전트는 버튼의 위치나 폼 필드의 의미를 추측해야 하는 어려움을 겪는다. 결과적으로 비용은 높고 정확도는 낮은 상태가 지속되고 있다.
- •기존 방식은 HTML 스크래핑과 스크린샷 분석에 의존하여 비효율적이다
- •수천 개의 토큰이 각 이미지 처리에 소모되어 비용 부담이 크다
- •에이전트가 UI 요소를 정확히 파악하지 못해 동작 오류가 빈번하다
00:28
WebMCP Early Preview: Google Chrome의 새로운 표준 발표
Google Chrome 팀은 AI 에이전트가 웹사이트와 직접 소통할 수 있게 하는 WebMCP 초기 프리뷰를 발표했다. WebMCP는 웹사이트가 구조화된 도구(Tools)를 에이전트에게 직접 노출할 수 있도록 설계된 새로운 표준이다. 이를 통해 에이전트는 더 이상 화면을 긁어낼 필요 없이 웹사이트가 제공하는 함수를 직접 호출할 수 있다. 이는 브라우저가 에이전트와 웹사이트 사이의 중재자 역할을 수행함을 의미한다.
- •Google Chrome 팀이 WebMCP를 통해 에이전트용 웹 표준을 제시했다
- •웹사이트가 에이전트에게 직접 구조화된 도구를 노출할 수 있다
- •스크래핑 없이 함수 호출 방식으로 상호작용이 가능해진다
01:14
MCP의 기원과 브라우저로의 확장
MCP(Model Context Protocol)는 Anthropic이 로컬 데이터와 도구를 모델에 연결하기 위해 처음 제안한 프로토콜이다. WebMCP는 이 개념을 브라우저 환경으로 확장하여 웹사이트 자체가 MCP 서버 역할을 하도록 만든다. Microsoft와 Google은 작년 3분기부터 협력하여 이 사양을 구체화해 왔으며 이는 특정 기업의 독점 기술이 아닌 개방형 표준을 지향한다. 과거 제안되었던 Script Tools나 Web Model Context와 같은 아이디어들이 WebMCP로 통합되었다.
- •Anthropic의 MCP를 브라우저 환경으로 확장한 것이 WebMCP이다
- •Microsoft와 Google이 협력하여 표준 사양을 구축했다
- •웹사이트가 에이전트에게 직접 데이터를 제공하는 MCP 서버가 된다
05:07
상호작용의 세 가지 기둥: Context, Capabilities, Coordination
에이전트와 사용자, 사이트 간의 상호작용은 세 가지 핵심 기둥으로 구성된다. Context는 에이전트가 사용자의 현재 상태와 이전 활동 데이터를 이해하는 능력이다. Capabilities는 에이전트가 사용자를 대신해 폼을 채우거나 버튼을 누르는 등의 실제 행동을 수행하는 능력을 의미한다. Coordination은 사용자와 에이전트가 동일한 UI에서 충돌 없이 협업할 수 있도록 흐름을 제어하는 기술이다. 이 세 요소가 결합되어 인간 참여형(Human-in-the-loop) 에이전트 시스템이 완성된다.
- •Context는 사용자의 현재 상태와 맥락 데이터를 제공한다
- •Capabilities는 에이전트가 사이트 내에서 직접 행동을 수행하게 한다
- •Coordination은 사용자와 에이전트 간의 협업 흐름을 관리한다
06:31
Chrome 146 및 구현 현황
WebMCP 기능은 최신 Google Chrome 버전(146 이상)에서 특정 플래그를 활성화하여 테스트할 수 있다. 이는 단순한 이론적 제안을 넘어 실제 브라우저 엔진에 구현되기 시작했음을 의미한다. 향후 Google Cloud Next나 Google I/O와 같은 주요 행사에서 더 구체적인 로드맵과 활용 사례가 공개될 것으로 예상된다. 개발자들은 Chrome Early Preview 프로그램을 통해 이 API에 미리 접근하고 실험해 볼 수 있다.
- •Chrome 146 버전부터 플래그를 통해 WebMCP 기능을 활성화할 수 있다
- •주요 기술 컨퍼런스에서 구체적인 로드맵이 공개될 예정이다
- •개발자들은 조기 프리뷰 프로그램을 통해 API 실험이 가능하다
08:05
구조화된 상호작용: Declarative 및 Imperative API
WebMCP는 두 가지 주요 API를 통해 웹사이트 기능을 노출한다. Declarative API는 기존 HTML 폼에 도구 이름과 설명을 추가하여 에이전트가 이를 인식하게 하는 선언적 방식이다. Imperative API는 JavaScript를 사용하여 더 복잡하고 동적인 상호작용을 정의하며 에이전트가 호출할 수 있는 구체적인 도구 스키마를 등록한다. 이 두 API는 웹사이트를 에이전트 친화적으로 만들어 DOM 조작보다 훨씬 빠르고 안정적인 워크플로를 제공한다.
- •Declarative API는 HTML 폼을 통해 표준 작업을 정의한다
- •Imperative API는 JavaScript로 복잡한 동적 상호작용을 구현한다
- •두 API 모두 DOM 조작보다 높은 신뢰성과 속도를 보장한다
javascript
navigator.modelContext.registerTool({ name: 'add-to-cart', description: 'Add a product to the shopping cart', inputSchema: { type: 'object', properties: { productId: { type: 'string' }, quantity: { type: 'number' } }, required: ['productId'] }, execute: (productId, quantity) => { addToCart(productId, quantity); return { content: [{ type: 'text', text: 'Item added!' }] }; } });Imperative API를 사용하여 웹사이트의 특정 기능을 AI 에이전트가 호출할 수 있는 도구로 등록하는 예시
실무 Takeaway
- WebMCP는 HTML 스크래핑 대신 구조화된 API 호출을 사용하여 에이전트의 토큰 비용을 획기적으로 절감한다
- 웹 개발자는 에이전트 전용 인터페이스를 제공함으로써 자사 서비스의 AI 접근성을 높일 수 있다
- 사용자와 에이전트가 브라우저 내에서 실시간으로 협업하는 Coordination 기능이 표준화된다
언급된 리소스
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
원문 발행 2026. 02. 12.수집 2026. 02. 21.출처 타입 YOUTUBE
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.