핵심 요약
NVIDIA KGMON 팀은 복잡한 정형 데이터 분석을 위해 'NVIDIA KGMON Data Explorer' 아키텍처를 공개했다. 이 시스템은 데이터 과학자의 작업 방식을 모방하여 학습 단계에서 재사용 가능한 도구를 생성하고 추론 단계에서 이를 활용하는 3단계 접근 방식을 취한다. 이를 통해 DABStep 벤치마크에서 Claude Code 대비 30배 빠른 속도와 고난도 작업에서의 압도적인 성능을 증명하며 SOTA를 달성했다. 정형 데이터 분석 에이전트가 단순히 코드를 짜는 것을 넘어 스스로 라이브러리를 구축하여 효율성을 극대화하는 새로운 패러다임을 제시한다.
배경
LLM 에이전트 아키텍처(ReAct)에 대한 이해, Python 및 Pandas를 이용한 데이터 분석 기초, NeMo Agent Toolkit 프레임워크 지식
대상 독자
LLM 에이전트 개발자, 데이터 과학자, MLOps 엔지니어
의미 / 영향
이 아키텍처는 에이전트가 단순히 코드를 생성하는 단계를 넘어 스스로 라이브러리를 구축하고 최적화하는 자기 진화형 도구 사용 패턴을 제시한다. 이는 향후 복잡한 엔터프라이즈 데이터 분석 자동화의 표준 모델이 될 가능성이 높다.
섹션별 상세
NVIDIA KGMON Data Explorer는 NeMo Agent Toolkit을 기반으로 구축되었으며, 오픈 엔드 탐색적 데이터 분석(EDA)과 다단계 규칙 기반 표 형식 데이터 QA라는 두 가지 핵심 루프를 제공한다.

EDA 루프에서는 ReAct 에이전트가 주피터 노트북 도구와 상호작용하며, 시각화 결과물이 생성될 경우 VLM(Vision-Language Model)이 이를 해석하여 텍스트로 변환함으로써 에이전트의 이해도를 높인다.

DABStep 벤치마크 대응을 위해 도입된 3단계 접근 방식은 학습(Learning), 추론(Inference), 오프라인 성찰(Offline Reflection)로 구성되어 데이터 과학자의 전문적인 워크플로우를 자동화한다.

학습 단계에서는 고성능 모델(Opus 4.5/4.6)이 여러 작업을 수행하며 공통된 로직을 추출하고, 이를 'helper.py'라는 최적화된 라이브러리와 few-shot 예제로 정제하여 중복을 제거한다.
추론 단계에서는 학습 단계에서 생성된 도구를 활용하여 경량 모델(Haiku 4.5)이 단일 패스 루프로 작업을 수행하며, 이를 통해 토큰 비용과 지연 시간을 획기적으로 줄이면서도 높은 정확도를 유지한다.
오프라인 성찰 단계에서는 고성능 모델이 에이전트의 결과물을 검토하고 그룹 일관성을 분석하여 얻은 통찰을 다음 추론의 시스템 프롬프트에 주입함으로써 지속적인 성능 향상을 꾀한다.
DABStep 벤치마크 결과, NVIDIA의 방식은 고난도 작업에서 89.95점을 기록하여 Claude Code(66.93점)를 압도했으며, 작업당 소요 시간을 10분에서 20초로 단축하는 30배의 속도 향상을 보였다.
실무 Takeaway
- 복잡한 데이터 분석 작업 시 매번 처음부터 코드를 짜는 대신 공통 로직을 'helper.py'와 같은 재사용 가능한 도구로 모듈화하면 추론 속도를 30배 이상 높일 수 있다.
- 고성능 모델로 도구를 설계(Learning)하고 경량 모델로 실행(Inference)하는 전략을 통해 비용 효율성과 성능을 동시에 확보할 수 있다.
- 시각적 데이터(차트 등)를 VLM으로 텍스트화하여 에이전트에게 피드백하는 구조는 에이전트가 데이터의 맥락을 더 정확히 파악하게 돕는다.
언급된 리소스
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료