핵심 요약
NumbyAI는 사용자의 금융 데이터를 외부 클라우드로 전송하지 않고 로컬 환경에서 처리하는 금융 거래 분류 도구이다. 휴리스틱 엔진과 로컬 LLM(Ollama)을 결합하여 다양한 은행의 CSV 형식을 자동으로 감지하고 거래 내역을 카테고리별로 분류한다. 규칙 기반 엔진을 통해 반복적인 거래를 즉시 처리하며, LLM은 복잡하거나 모호한 항목을 병렬로 처리하여 효율성을 높인다. 사용자는 이를 통해 데이터 유출 걱정 없이 개인화된 지출 분석 대시보드를 구축할 수 있다.
배경
Python 3.11 이상, Node.js 18 이상, Ollama 설치 및 실행 환경
대상 독자
개인정보 보호를 중요시하며 로컬 AI를 활용해 금융 데이터를 관리하고 싶은 개발자 및 사용자
의미 / 영향
이 프로젝트는 LLM이 클라우드 서비스에 국한되지 않고 개인의 프라이버시가 중요한 도메인에서 로컬로 충분히 활용될 수 있음을 보여준다. 특히 정형 데이터(CSV)와 비정형 데이터(LLM 분류)를 결합한 하이브리드 처리 모델은 향후 다양한 로컬 AI 애플리케이션의 표준 아키텍처가 될 가능성이 높다.
섹션별 상세
로컬 우선 아키텍처를 채택하여 모든 금융 데이터 처리가 사용자의 로컬 머신 내에서만 이루어진다. 외부 API 호출이나 데이터 공유가 전혀 발생하지 않으며, Ollama를 추론 엔진으로 사용하여 클라우드 구독 비용 없이 개인화된 AI 분류 기능을 제공한다.
지능형 휴리스틱 파서가 탑재되어 수동 컬럼 매핑 없이도 메타데이터 행, 날짜 형식, 통화, 숫자 표기법(EU/US 방식 등)을 자동으로 감지한다. 날짜 밀도와 숫자 데이터 분포를 점수화하여 컬럼의 역할을 식별하며, 신뢰도가 낮은 경우에만 LLM을 호출하여 부족한 정보를 보완하는 하이브리드 방식을 사용한다.

다단계 분류 파이프라인을 통해 처리 효율을 극대화한다. 업로드된 데이터는 먼저 정규표현식 기반의 규칙 엔진을 거쳐 기저장된 패턴으로 즉시 분류되며, 일치하는 규칙이 없는 항목만 Ollama의 병렬 워커를 통해 배치 처리된다. 결과가 불확실한 항목은 별도의 검토 큐로 전달되어 사용자의 최종 확인을 거친다.
사용자 친화적인 대시보드와 규칙 어드바이저 기능을 제공한다. 분류된 데이터를 바탕으로 카테고리별 지출 현황, 예산 대비 실제 집행액, 월별 현금 흐름 추이를 시각화한다. 규칙 어드바이저는 사용자의 분류 패턴을 분석하여 재사용 가능한 규칙을 제안함으로써 향후 업로드 시 처리 속도를 높인다.


FastAPI와 React 기반의 현대적인 기술 스택으로 구성되어 있으며 SQLite와 PostgreSQL을 모두 지원한다. Docker를 통한 간편한 배포가 가능하며, Auth0 연동을 통해 다중 사용자 환경으로 확장할 수 있는 유연한 구조를 갖추고 있다.
실무 Takeaway
- 금융 데이터와 같이 민감한 정보는 Ollama와 같은 로컬 LLM을 활용하여 프라이버시 침해 없이 AI 기능을 구현할 수 있다.
- LLM 호출 전 휴리스틱 엔진과 규칙 기반 필터를 먼저 적용함으로써 추론 비용을 절감하고 전체 시스템의 처리 속도를 획기적으로 높일 수 있다.
- 복잡한 비정형 CSV 파싱 문제를 해결하기 위해 신뢰도 기반의 하이브리드(규칙+AI) 접근 방식을 적용하면 데이터 정제 효율이 극대화된다.
언급된 리소스
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료