핵심 요약
기업들이 보유한 수십 년 된 스캔본 문서는 검색과 편집이 불가능하여 막대한 생산성 손실과 비용을 야기한다. Gemini 3 Pro와 같은 시각 언어 모델(VLM)은 단순 텍스트 추출을 넘어 헤더, 표, 목록 등 문서의 시각적 구조를 이해하고 보존할 수 있는 능력을 갖췄다. 본 아티클은 Roboflow Workflows를 사용하여 Gemini 3 Pro 기반의 자동화 파이프라인을 구축하고, 이를 통해 레거시 문서를 현대적인 지식 관리 시스템에 적합한 Markdown 형식으로 변환하는 실전 가이드를 제공한다. 특히 프로덕션 환경에서의 성능 최적화와 이미지 전처리 기법을 포함하여 실질적인 구현 방안을 제시한다.
배경
Roboflow 계정 및 Workflows 사용 권한, Google Gemini API 키, JSON 데이터 구조에 대한 기본 이해
대상 독자
레거시 문서의 디지털 전환을 담당하는 데이터 엔지니어 및 LLM 서비스 개발자
의미 / 영향
이 기술은 수십 년간 방치된 기업의 비정형 데이터를 즉시 활용 가능한 지식 자산으로 전환하며, RAG 시스템의 데이터 품질을 획기적으로 개선할 수 있는 기반을 제공한다.
섹션별 상세

Convert this document page to markdown format. Preserve all structure including:
- Headers (use # ## ### for hierarchy)
- Lists (numbered and bulleted)
- Tables (use markdown table syntax)
- Text formatting (bold, italic)
- Paragraph breaks
Return only the markdown content without any preamble or explanation.
Define the output structure:
{
"markdown_content": "The complete markdown text extracted from the document page, preserving all headers, lists, tables, and formatting"
}Gemini 3 Pro 블록에 입력하는 시스템 프롬프트 및 출력 JSON 스키마 정의 예시



실무 Takeaway
- 단순 OCR 대신 Gemini 3 Pro를 사용하면 문서의 계층 구조와 표 형식을 그대로 유지한 Markdown 추출이 가능하여 데이터 활용도를 극대화할 수 있다.
- 저품질 스캔본은 Roboflow의 Contrast Equalization이나 Image Blur 블록을 Gemini 앞단에 배치하여 인식 정확도를 사전에 개선해야 한다.
- 도메인별 특화 프롬프트(기술 매뉴얼, 법률 문서 등)를 작성하고 Few-shot 예시를 포함하면 추출 오류를 최소화하고 일관된 포맷을 유지할 수 있다.
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.