핵심 요약
데이터 분석가는 반복적인 단순 데이터 추출 요청으로 인해 업무 몰입에 방해를 받는 '데이터 셰퍼드' 문제에 직면한다. 소스그래프는 이를 해결하기 위해 사내 데이터 웨어하우스와 도구들에 접근할 수 있는 AI 슬랙 봇인 DataBot을 구축했다. DataBot은 Gemini 2.5 Flash를 기반으로 BigQuery, Looker, Sourcegraph Deep Search 등의 도구를 조합하여 답변을 생성하며, 생성된 SQL을 투명하게 공개하여 사용자가 직접 검증할 수 있게 한다. 이를 통해 데이터 분석가의 업무는 직접 쿼리를 작성하는 방식에서 AI의 결과물을 감사하는 방식으로 전환되어 업무 효율이 극대화되었다.
배경
SQL 기초 지식, LLM Tool Calling 개념, GCP Cloud Functions 운영 경험
대상 독자
사내 데이터 분석 자동화를 고민하는 데이터 엔지니어 및 LLM 에이전트 개발자
의미 / 영향
데이터 분석 업무가 직접 수행에서 AI 결과 검토로 패러다임이 변화하고 있음을 보여준다. 이는 분석가의 생산성을 10배 이상 향상시킬 수 있는 실질적인 사례이다.
섹션별 상세
이미지 분석

DataBot이 사용하는 도구 목록과 각 도구의 역할을 정리한 표이다. 에이전트가 데이터 생태계 내에서 어떤 기능을 수행하는지 구체적으로 보여준다.
DataBot이 활용하는 주요 도구와 기능 정의표

DataBot이 슬랙에서 사용자의 질문에 답변하고, 그 근거가 되는 SQL 쿼리를 함께 제시하는 실제 사례이다. 주간 트렌드 비교와 같은 복잡한 분석을 수행하는 능력을 입증한다.
데이터 분석 결과와 SQL 쿼리를 출력하는 슬랙 인터페이스

사용자가 슬랙 대화만으로 설정 파일 수정을 위한 GitHub PR 생성을 요청하고, DataBot이 이를 처리하는 과정을 보여준다. 단순 조회를 넘어 코드 수정까지 가능한 에이전트의 확장성을 나타낸다.
GitHub PR 생성을 자동화하는 DataBot의 워크플로우

DataBot 배포 시 중요한 설정값인 동시성과 타임아웃의 권장 수치와 그 이유를 설명하는 표이다. 안정적인 슬랙 봇 운영을 위한 실무적인 팁을 제공한다.
슬랙 봇 배포를 위한 주요 설정값 가이드
실무 Takeaway
- AI 에이전트 도입 시 답변의 근거가 되는 SQL이나 소스코드를 함께 제시하여 사용자가 직접 감사할 수 있는 구조를 만들어야 한다.
- 비즈니스 로직과 데이터 스키마에 대한 지식을 SCHEMA_CONTEXT와 같은 구조화된 프롬프트로 관리하여 모델의 환각을 방지하고 정확도를 높여야 한다.
- 단일 도구 사용보다는 여러 데이터 소스와 분석 도구를 체이닝하여 복합적인 질문에 대응할 수 있는 능력이 에이전트의 가치를 결정한다.
언급된 리소스
AI 요약 · 북마크 · 개인 피드 설정 — 무료