이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.
핵심 요약
n8n의 AI 에이전트 기능을 활용하면 복잡한 코딩 없이도 이미지 분석부터 데이터 저장까지 이어지는 강력한 자동화 워크플로우를 완성할 수 있다. Gemini 1.5 Pro의 뛰어난 멀티모달 성능이 영수증의 텍스트와 구조를 정확히 파악한다.
배경
수동으로 입력하기 번거로운 가계부 작성을 AI와 자동화 도구를 결합해 해결하려는 시도이다.
대상 독자
업무 자동화에 관심 있는 기획자, 개인 자산 관리를 자동화하고 싶은 사용자, n8n 활용법을 익히려는 개발자
의미 / 영향
영수증 관리와 같은 단순 반복적인 수동 입력 업무를 AI가 완전히 대체하여 개인이나 기업의 비용 관리 효율성을 극대화한다. 노코드 도구인 n8n을 통해 누구나 자신만의 맞춤형 AI 비서를 구축할 수 있는 환경이 실질적으로 가능해졌다.
챕터별 상세
00:00
AI 가계부 시스템 소개 및 시연
텔레그램으로 영수증 이미지를 전송하면 AI가 이를 분석하여 구글 시트에 일자, 상호명, 품목, 금액을 자동으로 기입하는 시스템이다. 사용자가 이미지를 올리면 즉시 '처리 중' 메시지가 전송되며, 분석 완료 후 시트 업데이트와 함께 요약 알림이 도착한다. 영수증 내 여러 품목을 개별 행으로 분리하여 입력하거나 합계만 입력하는 등 프롬프트 수정을 통해 동작 방식을 자유롭게 변경할 수 있다.
- •영수증 이미지 전송 시 실시간 데이터 추출 및 구글 시트 자동 기록
- •프롬프트 제어를 통한 데이터 입력 형식 커스터마이징 가능
- •텔레그램을 인터페이스로 활용하여 접근성 극대화
02:29
구글 시트 가계부 양식 준비
데이터가 저장될 구글 시트를 생성하고 일자, 상호명, 품목, 금액으로 구성된 헤더를 작성했다. 작성된 헤더 영역을 선택한 뒤 '표로 변환' 기능을 적용하여 데이터 구조를 명확히 했다. 이 과정은 n8n의 구글 시트 노드가 데이터를 정확한 열에 매핑하기 위한 사전 작업이다. 구글 드라이브에 저장된 해당 파일의 ID를 확인하여 n8n 연동 준비를 마쳤다.
- •일자, 상호명, 품목, 금액의 4개 필드로 구성된 시트 헤더 생성
- •구글 시트의 '표로 변환' 기능을 활용한 데이터 구조화
- •n8n 연동을 위한 시트 파일 및 시트 이름 확인
03:31
텔레그램 트리거 및 안내 메시지 설정
n8n에서 Telegram Trigger 노드를 추가하여 메시지 수신 시 워크플로우가 시작되도록 구성했다. 트리거 직후 Send Text Message 노드를 연결하여 사용자에게 영수증 분석이 시작되었음을 알리는 안내 문구를 즉시 발송한다. 트리거 노드의 설정에서 'Download Images/Files' 옵션을 활성화하여 전송된 영수증 이미지를 바이너리 데이터로 확보했다. 이는 AI 모델이 이미지를 직접 읽을 수 있도록 하기 위한 필수 설정이다.
- •Telegram Trigger 노드를 통한 실시간 메시지 수신 환경 구축
- •사용자 경험 향상을 위한 즉각적인 '처리 중' 안내 메시지 전송
- •이미지 자동 다운로드 옵션 활성화를 통한 바이너리 데이터 확보
04:51
AI 에이전트 및 Gemini 1.5 Pro 구성
AI Agent 노드를 생성하고 구글의 Gemini 1.5 Pro 모델을 연결했다. AI가 구글 시트에 직접 데이터를 쓸 수 있도록 Google Sheets Tool을 에이전트에 추가했다. 이때 시트의 헤더 이름이 한글일 경우 발생하는 호환성 문제를 해결하기 위해 내부 매핑 키값을 영어(date, shop, product, price)로 변경했다. Structured Output Parser를 연결하여 최종 응답이 텔레그램 메시지 형식에 맞는 JSON 구조로 출력되도록 설정했다.
- •멀티모달 분석을 위한 Gemini 1.5 Pro 모델 연동
- •AI가 외부 도구를 제어할 수 있도록 Google Sheets Tool 연결
- •한글 헤더 호환성 해결을 위한 영어 매핑 키값 설정
06:39
핵심 프롬프트 작성 및 이미지 패스스루 설정
AI가 수행해야 할 단계를 구체적으로 정의한 시스템 프롬프트를 작성했다. 영수증 이미지에서 구매 내역을 추출하고, 추출된 데이터를 구글 시트 도구를 사용해 기입하며, 마지막으로 사용자에게 보낼 요약 메시지를 생성하라는 지침을 포함했다. AI Agent 노드의 옵션에서 'Automatically Pass-through Binary Images'를 활성화하여 텔레그램에서 받은 이미지가 모델의 입력값으로 자동 전달되게 했다. 이 설정 덕분에 별도의 이미지 처리 로직 없이도 AI가 영수증을 직접 분석할 수 있다.
- •추출, 기입, 알림의 3단계 프로세스를 정의한 시스템 프롬프트
- •바이너리 이미지 자동 전달 옵션을 통한 워크플로우 단순화
- •JSON 포맷을 활용한 결과 메시지 구조화
json
{
"message": "가계부 작성이 완료되었습니다. (상호명)에서 (품목) 등 (금액)원을 지출하셨네요!"
}AI 에이전트가 텔레그램으로 보낼 응답 메시지의 구조를 정의하는 JSON 스키마 예시
12:01
최종 연동 및 전체 시스템 테스트
모든 노드를 연결하고 워크플로우를 활성화한 뒤 실제 영수증 이미지로 테스트를 진행했다. 텔레그램으로 사진을 보내자 구글 시트에 상호명과 품목별 금액이 실시간으로 기록되는 것을 확인했다. 여러 품목이 포함된 영수증의 경우 AI가 각 항목을 개별 행으로 정확히 분리하여 입력했다. 최종적으로 텔레그램을 통해 지출 요약 메시지가 정상적으로 도착하며 전체 자동화 프로세스가 완결되었다.
- •실제 영수증 이미지를 활용한 엔드투엔드 워크플로우 검증
- •다중 품목 영수증의 개별 행 분리 입력 기능 확인
- •구글 시트 기록과 텔레그램 알림의 동기화 성공
실무 Takeaway
- n8n의 AI Agent 노드와 멀티모달 LLM을 결합하면 이미지 기반의 복잡한 데이터 추출 업무를 코드 없이 자동화할 수 있다.
- 구글 시트와 같은 외부 도구 연동 시 한글 헤더는 영어 매핑 키로 변환하여 설정해야 AI 에이전트가 오류 없이 데이터를 입력한다.
- Structured Output Parser를 사용해 AI의 응답 형식을 JSON으로 고정하면 자동화 시스템의 안정성과 데이터 파싱 정확도가 대폭 향상된다.
- 텔레그램 트리거의 이미지 자동 다운로드 옵션과 AI 노드의 이미지 패스스루 기능을 활용해 이미지 처리 파이프라인을 극도로 단순화할 수 있다.
언급된 리소스
API DocsGoogle AI Studio (Gemini API)
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
원문 발행 2025. 12. 06.수집 2026. 02. 21.출처 타입 YOUTUBE
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.