핵심 요약
데이터 분석가들은 반복적인 단순 질문 응대로 인해 잦은 문맥 전환과 업무 중단을 겪는다. Sourcegraph는 이를 해결하기 위해 Gemini 2.5 Flash 기반의 Slack 봇인 DataBot을 구축했다. DataBot은 BigQuery, Looker, GitHub 등 다양한 도구를 조합해 SQL 쿼리를 실행하고, 소스 코드 검색(Deep Search)을 통해 데이터 변환 로직을 파악한다. 이를 통해 데이터 팀의 업무는 직접 쿼리를 작성하는 것에서 AI의 결과를 검토(Auditing)하는 방식으로 전환되어 효율성이 극대화되었다.
배경
LLM Tool Use(Function Calling) 개념, SQL 및 데이터 웨어하우스(BigQuery 등) 기초 지식, Slack API 및 서버리스 아키텍처 이해
대상 독자
데이터 엔지니어, 데이터 분석가, LLM 에이전트를 프로덕션에 도입하려는 개발자
의미 / 영향
AI 에이전트가 데이터 분석가의 단순 반복 업무를 대체함으로써 전문 인력은 더 복잡하고 가치 있는 분석에 집중할 수 있게 된다. 특히 코드 검색과 데이터 쿼리를 결합한 방식은 데이터의 흐름을 끝까지 추적해야 하는 현대적 데이터 엔지니어링 환경에서 강력한 도구가 될 것이다.
섹션별 상세
@DataBot Create a PR to improve SCHEMA_CONTEXT so that when you are looking at events and their metadata you are selecting the most recent events to observe, instead of 30 days, look at 7 days by default and order by timestamp desc사용자가 DataBot에게 GitHub PR 생성을 요청하는 Slack 메시지


SELECT eventName, COUNT(*) AS event_count
FROM telligentsourcegraph.telemetry.v2_events
WHERE DATE(timestamp) = DATE_SUB(CURRENT_DATE(), INTERVAL 1 DAY)
AND eventName LIKE 'search:%'
GROUP BY eventName
ORDER BY event_count DESC
LIMIT 3DataBot이 상위 3개 검색 이벤트를 조회하기 위해 자동으로 생성한 SQL 쿼리 예시


실무 Takeaway
- 단순 챗봇이 아닌 실제 데이터 도구(BigQuery, GitHub 등)를 호출할 수 있는 에이전트 구조를 설계하여 할루시네이션을 방지하고 실질적인 업무 자동화를 구현해야 한다.
- AI의 답변에 SQL 원문을 포함시켜 데이터 분석가의 역할을 '수행'에서 '감사(Audit)'로 전환함으로써 질문당 처리 시간을 10분에서 30초 내외로 단축할 수 있다.
- SCHEMA_CONTEXT와 같은 구조화된 지식 베이스를 지속적으로 업데이트하여 팀 내 파편화된 비즈니스 로직을 AI가 활용 가능한 자산으로 관리해야 한다.
언급된 리소스
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.