Abhishek ThakurTutorial

코드 한 줄 없이 구축하는 고급 확장형 RAG 시스템: NyRAG 가이드

Abhishek Thakur가 개발한 오픈소스 도구 NyRAG를 활용하여 코드 작성 없이 Vespa 기반의 고성능 확장형 RAG 시스템을 구축하고 배포하는 방법을 소개한다.

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

NyRAG는 Vespa의 강력한 검색 엔진 기능을 활용하여 복잡한 RAG 파이프라인을 설정 파일만으로 구축할 수 있게 해준다. 로컬 환경과 클라우드 환경 모두를 지원하며, 확장성 있는 검색 시스템을 손쉽게 구현할 수 있다.

배경

대규모 데이터를 처리하는 RAG 시스템 구축은 복잡한 코딩과 인프라 설정이 필요하지만, 이를 자동화하려는 시도가 늘고 있다.

대상 독자

AI 엔지니어, 데이터 과학자, 코딩 없이 RAG를 구축하려는 개발자

의미 / 영향

NyRAG는 Vespa라는 강력하지만 진입장벽이 높은 엔진을 대중화하여, 중소규모 팀도 엔지니어링 리소스 없이 확장 가능한 RAG 시스템을 운영할 수 있게 한다. 이는 상용 솔루션에 의존하지 않고도 고성능 검색 인프라를 내재화할 수 있는 기회를 제공한다.

챕터별 상세

00:00

NyRAG 소개 및 데모

NyRAG는 코드 작성 없이 고급 RAG 시스템을 구축할 수 있도록 설계된 오픈소스 도구이다. 영상에서는 영화 추천 시스템 스키마 예시를 통해 Vespa 기반의 검색 결과가 어떻게 생성되는지 보여준다. GPT-4o와 같은 LLM을 연결하여 관련 소스를 기반으로 답변을 생성하는 과정을 시연한다.

•Vespa 기반의 검색 엔진 활용
•LLM 응답 생성 데모
•노코드 인터페이스 제공

RAG는 외부 지식을 검색하여 LLM의 답변 정확도를 높이는 기술이다.

01:08

설치 및 환경 설정

uv pip install nyrag 명령어를 통해 간단히 설치할 수 있으며, nyrag ui 명령어로 웹 인터페이스를 실행한다. 로컬 모드와 클라우드 모드를 모두 지원하며, 클라우드 모드 사용 시 Vespa Cloud 계정이 필요하다. 로컬 실행 시에는 Docker 또는 Podman이 설치되어 있어야 Vespa 인스턴스를 띄울 수 있다.

•uv 패키지 매니저 권장
•Docker 기반 로컬 배포
•Vespa Cloud 연동 지원

Docker는 애플리케이션을 컨테이너화하여 어디서든 동일하게 실행할 수 있게 돕는 도구이다.

02:48

데이터 크롤링 및 인덱싱 설정

웹사이트 URL을 입력하여 데이터를 자동으로 수집하는 웹 템플릿 기능을 제공한다. YAML 형식의 설정 인터페이스를 통해 크롤링 제외 경로, 로봇 배제 표준 준수 여부 등을 세밀하게 조정한다. 임베딩 모델로는 sentence-transformers의 all-MiniLM-L6-v2를 기본으로 사용하며 청크 크기와 겹침 정도를 설정할 수 있다.

•웹 템플릿 기반 자동 크롤링
•임베딩 및 청킹 파라미터 설정
•YAML 기반 구성 관리

임베딩은 텍스트를 컴퓨터가 이해할 수 있는 벡터 숫자로 변환하는 과정이다.

04:09

LLM 및 검색 엔진 구성

OpenRouter, OpenAI, Anthropic 등 다양한 LLM API를 연결할 수 있는 설정을 지원한다. 검색 시 사용할 Vespa의 히트 수와 쿼리 변형 개수를 지정하여 검색 품질을 높인다. 설정이 완료되면 Start Crawl Process 버튼을 눌러 데이터 수집과 인덱싱을 시작한다.

•다양한 LLM API 공급자 지원
•검색 결과 최적화 파라미터
•인덱싱 프로세스 자동화

OpenRouter는 여러 LLM API를 하나의 인터페이스로 사용할 수 있게 해주는 서비스이다.

10:30

로컬 문서 기반 RAG 구축

웹 크롤링뿐만 아니라 로컬에 저장된 PDF, Markdown 등의 문서를 인덱싱하는 Doc 템플릿 기능을 설명한다. 로컬 경로를 지정하면 marker-down 라이브러리를 통해 문서를 마크다운으로 변환하여 처리한다. OCR 기능은 현재 지원하지 않지만 텍스트 추출이 가능한 모든 문서 형식을 지원한다.

•로컬 문서 인덱싱 지원
•마크다운 변환 처리
•Vespa 기반 벡터 검색

OCR은 이미지 속의 텍스트를 인식하여 디지털 데이터로 변환하는 기술이다.

실무 Takeaway

NyRAG를 사용하면 복잡한 Vespa 스키마 설계 없이도 고성능 벡터 검색 시스템을 즉시 구축할 수 있다.
로컬 Docker 환경을 활용하여 데이터 보안을 유지하면서도 강력한 RAG 파이프라인 실험이 가능하다.
쿼리 변형 기능을 활성화하면 단일 검색어보다 훨씬 풍부한 관련 문서를 검색 결과에 포함시킬 수 있다.

언급된 리소스

GitHubNyRAG GitHub Repository

AI 분석 전체 내용 보기

AI 요약 · 북마크 · 개인 피드 설정 — 무료

출처 · 인용 안내

원문 발행 2026. 01. 19.수집 2026. 02. 21.출처 타입 YOUTUBE

인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.

코드 한 줄 없이 구축하는 고급 확장형 RAG 시스템: NyRAG 가이드 | AI Trends