핵심 요약
Mazda는 전기차 도입과 연결된 차량 데이터의 증가로 인한 서비스 상담원의 업무 과부하를 해결하기 위해 Databricks 기반의 GenAI 솔루션을 도입했다. 단 2명의 데이터 과학자로 구성된 소규모 팀이 8주 만에 RAG 기반의 AI 어시스턴트 파일럿을 구축하는 성과를 거두었다. 이 시스템은 Unity Catalog를 통해 데이터 거버넌스를 확보하고, MLflow 3를 활용해 정교한 평가 체계를 구축함으로써 실질적인 업무 효율성을 입증했다. 결과적으로 Mazda는 정형 데이터와 비정형 데이터를 결합한 반복 가능한 GenAI 파이프라인을 확보하게 되었다.
배경
RAG(Retrieval-Augmented Generation)의 기본 개념, Databricks Lakehouse 및 Unity Catalog에 대한 이해, MLflow를 이용한 실험 관리 지식
대상 독자
엔터프라이즈 GenAI 솔루션을 구축하려는 데이터 과학자 및 MLOps 엔지니어
의미 / 영향
소규모 팀도 통합 플랫폼을 통해 엔터프라이즈급 AI를 빠르게 배포할 수 있음을 보여주며, 제조 현장의 지식 관리 패러다임을 바꿀 것이다.
섹션별 상세
Mazda는 서비스 정보(SI) 문서와 차량 이력 데이터를 결합하여 상담원이 복잡한 진단 절차를 신속하게 파악할 수 있도록 돕는 RAG 시스템을 설계했다.
시스템 아키텍처는 프론트엔드(Streamlit)와 AI 에이전트가 코드 및 도구를 공유하도록 설계되어, VIN 입력 시 차량 컨텍스트를 즉시 주입하거나 필요시 도구를 호출하는 유연한 실행 모드를 지원한다.
Unity Catalog를 활용하여 데이터 거버넌스를 통합하고, 사용자 정의 함수(UDF)를 통해 VIN 또는 진단 코드에 따른 정밀한 문서 필터링을 구현함으로써 검색의 정확도를 높였다.
MLflow 3의 GenAI 평가 프레임워크를 도입하여 정성적인 피드백 중심의 개발에서 데이터 기반의 테스트 주도 개발(TDD) 방식으로 전환하고 성능을 객관적으로 검증했다.
다국어 임베딩 모델과 LLM의 번역 능력을 활용하여 핵심 아키텍처의 변경 없이도 다양한 시장으로 서비스를 확장할 수 있는 기반을 마련했다.
실무 Takeaway
- Unity Catalog의 UDF를 활용해 검색 전 단계에서 데이터를 필터링하면 RAG 시스템의 검색 정확도와 관련성을 획기적으로 개선할 수 있다.
- MLflow 3와 같은 평가 프레임워크를 초기부터 도입하여 정성적 피드백을 정량적 테스트 케이스로 변환하는 것이 시스템의 신뢰성을 확보하는 핵심이다.
- 인프라 관리를 최소화해주는 통합 플랫폼을 사용하면 단 2명의 소규모 팀으로도 8주라는 단기간에 복잡한 GenAI 프로덕션을 구축할 수 있다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료