핵심 요약
NTT DATA는 LlamaIndex를 통해 복잡한 레이아웃을 가진 기업 문서의 파싱 및 인덱싱 문제를 해결했다. 이를 통해 RAG 시스템의 정확도와 개발 효율성을 동시에 확보하며 2027년까지 완전한 AI 기반 기업으로 거듭나는 것을 목표로 한다.
배경
글로벌 IT 컨설팅 기업 NTT DATA의 글로벌 AI 오피스 디렉터 마누엘 데 후안이 LlamaIndex 도입 배경과 성과를 설명하는 인터뷰 영상입니다.
대상 독자
기업용 AI 솔루션 아키텍트, RAG 시스템 개발자, 디지털 전환 담당자
의미 / 영향
NTT DATA의 사례는 대규모 엔터프라이즈 환경에서 RAG 시스템을 구축할 때 발생하는 데이터 전처리 문제를 LlamaIndex가 효과적으로 해결할 수 있음을 보여준다. 특히 규제 문서와 같이 구조가 복잡한 문서를 다루는 금융, 법률 분야에서 LlamaIndex의 고급 인덱싱 기능은 필수적인 도구가 될 것이다.
챕터별 상세
00:30
NTT DATA의 AI 전략과 비전
NTT DATA는 2027년까지 완전한 AI 기반 기업이 되는 것을 목표로 한다. 고객 솔루션에 AI를 내장하는 것과 인사, 재무, 법무 등 내부 운영을 AI로 혁신하는 두 가지 축으로 전략을 추진 중이다. 글로벌 AI 오피스는 하이퍼스케일러 및 혁신 스타트업과의 파트너십을 통해 최첨단 기술을 현업에 적용한다.
- •2027년까지 완전한 AI 기반 기업 전환 목표
- •고객 솔루션 및 내부 운영 전반에 AI 내장
- •글로벌 파트너십을 통한 기술 경쟁력 확보
02:18
LlamaIndex 도입을 통한 RAG 시스템 혁신
LlamaIndex 도입 전에는 문서 인덱싱과 검색을 위해 커스텀 솔루션을 직접 구축해야 했으며 이는 시간 소모가 크고 오류가 잦았다. LlamaIndex의 재귀적 검색(Recursive Retriever)과 주변 컨텍스트 윈도우(Surrounding Context Window) 기능을 활용하여 문서의 구조와 계층을 유지하며 인덱싱 성능을 개선했다. 특히 챕터, 섹션, 서브섹션이 복잡하게 얽힌 규제 문서 파싱에서 높은 정확도를 확보했다.
- •커스텀 구축 대비 개발 시간 단축 및 오류 감소
- •재귀적 검색 기능을 통한 문서 계층 구조 유지
- •복잡한 레이아웃의 규제 문서 파싱 정확도 향상
RAG(Retrieval-Augmented Generation)는 외부 지식을 검색하여 LLM의 답변 정확도를 높이는 기술이다. LlamaIndex는 이 과정에서 데이터 파싱과 인덱싱을 최적화하는 프레임워크 역할을 한다.
04:07
개발 생산성 향상과 엔지니어링 문화의 변화
LlamaIndex는 복잡한 파싱 및 인덱싱 작업을 단순화하여 개발 주기를 크게 단축했다. 엔지니어들은 기초적인 컴포넌트 구축보다 혁신적인 기능 개발에 더 집중할 수 있게 됐다. 생성형 AI의 도입은 소프트웨어 개발 방식 자체를 변화시켰으며 팀 내 엔지니어들의 실험 정신과 학습 열기를 고취시켰다.
- •복잡한 작업 단순화로 개발 사이클 가속화
- •기초 구현보다 혁신적 기능 개발에 집중 가능
- •팀 내 기술적 열정과 실험적인 문화 확산
실무 Takeaway
- 복잡한 기업 문서는 단순 텍스트 추출보다 구조와 계층을 유지하는 인덱싱 전략이 필수적이다.
- LlamaIndex와 같은 프레임워크를 활용하면 커스텀 개발 비용을 줄이고 핵심 비즈니스 로직에 집중할 수 있다.
- RAG 시스템의 성능은 초기 데이터 파싱 및 인덱싱 단계의 품질에 크게 좌우된다.
언급된 리소스
API DocsLlamaIndex
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료