이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.
핵심 요약
대규모 서비스에서 벡터 검색 도입 시 확장성, 지연 시간, 필터링 성능이 핵심이다. 인간의 개입이 포함된 에이전트 아키텍처와 중앙 집중식 플랫폼 엔지니어링이 프로덕션 환경의 안정성을 보장한다.
배경
Booking.com의 AI 플랫폼 팀이 대규모 서비스에 벡터 검색과 생성형 AI를 도입한 경험을 공유한다.
대상 독자
AI 엔지니어, 플랫폼 엔지니어, RAG 시스템 설계자
의미 / 영향
대규모 트래픽 환경에서 벡터 검색과 에이전트 시스템을 안정적으로 운영하기 위한 플랫폼 엔지니어링의 중요성이 커지고 있다. 중앙 집중식 게이트웨이와 표준화된 프로토콜(MCP) 도입은 기업 내 AI 도입 속도를 가속화하는 핵심 전략이 될 것이다.
챕터별 상세
00:52
Booking.com의 벡터 검색 도입
기존 키워드 매칭 방식은 사용자 의도를 정확히 파악하는 데 한계가 있었다. 임베딩 기반의 의미적 검색으로 전환하며 초기에는 OpenSearch를 사용했다. 하지만 수억 개의 임베딩 데이터, 엄격한 지연 시간 요구사항, 복잡한 필터링 조건, 높은 동시성 처리가 필요해지면서 Weaviate로 마이그레이션했다.
04:52
파트너-게스트 메시징 에이전트
숙박 파트너가 체크인, 주차, 특별 요청 등에 대해 게스트의 질문에 답하는 것을 돕는 생성형 AI 시스템이다. Weaviate가 관련 응답 템플릿을 검색하고 GraphQL API가 숙소 및 예약 컨텍스트를 가져온다. 에이전트는 템플릿 제안, 답변 작성, 혹은 인간 상담원에게 대화를 넘기는 Human-in-the-loop 설계를 적용했다.
15:10
중앙 집중식 MCP 서버와 AI 플랫폼
내부 API와 외부 도구를 연결하기 위해 중앙 MCP 서버를 구축했다. GenAI 게이트웨이를 통해 모델 접근을 표준화하고 PII 마스킹, 가드레일, 프롬프트 인젝션 탐지, 로깅, 추적성 확보 및 비용 추적을 수행한다.
22:38
Weaviate 평가 및 운영
평가 기준은 1억 개의 임베딩, 필터링된 벡터 검색, 다중 스레드 동시성 테스트, 쓰기 중 읽기 성능, 비용 효율적인 인프라 프로비저닝이었다. 일반적인 벤치마크보다는 실제 프로덕션 환경의 부하를 고려한 평가를 우선시했다.
36:12
미래의 AI 여행 에이전트
사용자 선호도, 세션 컨텍스트, 의미적 기억을 포착하는 메모리 시스템이 향후 에이전트 기반 여행 경험의 핵심이 될 것이다. 장기적인 개인화를 통해 여행자가 원하는 것을 미리 파악하고 맞춤형 서비스를 제공하는 방향으로 발전하고 있다.
실무 Takeaway
- 대규모 서비스에서 벡터 DB 도입 시 단순 벤치마크보다 실제 부하(동시성, 필터링, 읽기/쓰기 혼합)를 고려한 평가가 필수적이다.
- GenAI 에이전트 설계 시 'Human-in-the-loop' 구조를 도입하여 모델이 답변하기 어려운 경우 사람에게 넘기는 안전장치를 마련해야 한다.
- 중앙 집중식 GenAI 게이트웨이를 통해 PII 마스킹, 프롬프트 인젝션 방어, 비용 추적을 표준화하여 플랫폼 안정성을 확보할 수 있다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
원문 발행 2026. 05. 18.수집 2026. 05. 18.출처 타입 YOUTUBE
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.