핵심 요약
스카이스캐너는 데이터브릭스의 통합 데이터 플랫폼을 통해 거버넌스가 확보된 고품질 데이터를 구축했으며, 이를 기반으로 매일 수억 건의 AI 예측을 수행하고 생성형 AI 에이전트로 서비스를 확장하고 있다.
배경
세계 최대 여행 검색 엔진인 스카이스캐너는 방대한 양의 사용자 검색 데이터를 실시간으로 처리하고 최적화된 결과를 제공해야 하는 과제를 안고 있다.
대상 독자
데이터 엔지니어, ML 엔지니어, 데이터 아키텍트, 기술 의사 결정권자
의미 / 영향
스카이스캐너의 사례는 대규모 데이터를 보유한 기업이 어떻게 통합 플랫폼을 통해 데이터 늪을 탈출하고 실질적인 AI 가치를 창출할 수 있는지 보여준다. 특히 데이터 거버넌스와 정제된 데이터 제품화가 ML 모델 가속화의 핵심 동력임을 입증했다. 향후 에이전트 기술 도입을 통해 여행 산업의 고객 경험이 더욱 개인화되고 자동화될 것으로 전망된다.
챕터별 상세
스카이스캐너의 데이터 규모와 도전 과제
- •매일 3,500만 건의 검색 및 350억 개의 이벤트 처리
- •15~20 페타바이트 규모의 방대한 데이터 저장 및 관리
- •데이터브릭스를 통한 파편화된 데이터 소스 통합
메달리온 아키텍처와 데이터 제품화
- •실버 레벨에서 매일 550억 개의 이벤트 처리 및 정제
- •재사용 가능한 Cornerstone Data Products 구축
- •비즈니스 전반의 데이터 접근성 및 신뢰성 향상
메달리온 아키텍처는 데이터의 정제 수준에 따라 계층을 나누어 관리하는 설계 방식이다.
Unity Catalog를 통한 거버넌스와 ML 예측
- •Unity Catalog를 통한 데이터 거버넌스 및 신뢰성 확보
- •매일 1억 8,000만 건의 비행 순위 예측 수행
- •데이터 품질 기반의 머신러닝 모델 개발 속도 가속화
Unity Catalog는 데이터와 AI 자산에 대한 통합 거버넌스를 제공하는 도구이다.
생성형 AI와 미래 전략
- •여행객의 50% 이상이 생성형 AI를 활용하는 시장 변화 대응
- •Agent Bricks를 활용한 차세대 고객 응대 에이전트 개발
- •통합 데이터 플랫폼 기반의 생성형 AI 혁신 가속화
Agent Bricks는 데이터브릭스 환경에서 AI 에이전트를 구축하기 위한 프레임워크를 의미한다.
실무 Takeaway
- 메달리온 아키텍처를 통해 매일 550억 개의 이벤트를 정제된 데이터 제품으로 변환하여 데이터 재사용성을 극대화했다.
- Unity Catalog를 도입하여 데이터 거버넌스를 중앙 집중화함으로써 1억 8천만 건의 예측을 수행하는 ML 모델의 신뢰도를 확보했다.
- 견고한 데이터 파운데이션을 먼저 구축함으로써 생성형 AI 및 에이전트 기술 도입 시 개발 속도를 획기적으로 높였다.
언급된 리소스
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.