Dell과 NVIDIA, 엔터프라이즈를 위한 차세대 에이전트 AI 인프라 공개

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

기업의 AI 도입이 파일럿 단계를 넘어 에이전트 AI와 대규모 추론 배포 단계로 진입했다. Dell AI Factory는 NVIDIA Vera Rubin NVL72 아키텍처와 Vera CPU를 기반으로 에이전트 워크로드를 가속화하고 추론 비용을 획기적으로 낮춘다. NVIDIA Confidential Computing을 통해 기업은 데이터와 모델 IP를 보호하며 온프레미스 환경에서 안전하게 frontier 모델을 운영할 수 있다. 다양한 소프트웨어 파트너십과 오픈 모델 지원을 통해 기업은 데이터와 워크플로에 최적화된 자율 에이전트를 구축할 수 있다.

배경

AI 인프라, 온프레미스 데이터센터, 에이전트 AI 아키텍처

대상 독자

엔터프라이즈 AI 인프라 설계자 및 에이전트 AI 도입을 고려하는 개발자

의미 / 영향

기업의 AI 인프라가 클라우드 중심에서 온프레미스 에이전트 AI 중심으로 이동하고 있음을 보여준다. 보안과 성능이 보장된 인프라를 통해 기업은 데이터 유출 우려 없이 실질적인 비즈니스 가치를 창출하는 자율 에이전트를 구축할 수 있다.

섹션별 상세

Dell PowerEdge XE9812 서버는 NVIDIA Vera Rubin NVL72를 탑재하여 기존 Blackwell 대비 에이전트 AI 추론 비용을 최대 10배 절감한다.

NVIDIA Vera CPU는 1.2 TB/s의 메모리 대역폭을 제공하여 x86 프로세서 대비 에이전트 워크로드를 50% 빠르게 처리하고 데이터베이스 쿼리 성능을 3배 향상시킨다.

NVIDIA Confidential Computing은 Fortanix, Google 등과 협력하여 기업이 온프레미스 환경에서 데이터 노출 없이 frontier 모델을 안전하게 배포하도록 지원한다.

Dell AI Factory는 OpenAI Codex, Palantir, ServiceNow 등과 통합되어 기업 내부 데이터와 워크플로에 연결된 자율 에이전트 구축을 지원한다.

NVIDIA와 ServiceNow의 엔터프라이즈 자율 에이전트 파트너십 발표 현장. — PhotoDell AI Factory를 통해 ServiceNow의 워크플로 자동화와 NVIDIA의 AI 인프라가 결합됨을 시각적으로 보여준다. 기업용 에이전트 AI 생태계 확장을 상징한다.

NVIDIA Nemotron, DeepSeek, MiniMax 등 다양한 오픈 모델이 Dell Enterprise Hub를 통해 제공되어 기업이 도메인에 특화된 모델을 직접 튜닝하고 운영할 수 있다.

Nemotron Labs와 OpenClaw 에이전트 관련 기술 스택 요약. — Diagram기업용 에이전트 구축을 위한 핵심 구성 요소인 Nemotron 모델과 OpenClaw 에이전트 프레임워크의 연관성을 설명한다.

비전, 오디오, 언어를 통합하는 Nemotron 3 Nano Omni 모델의 개념도. — Diagram멀티모달 기능을 통합하여 에이전트 효율성을 9배 향상시키는 Nemotron 3 Nano Omni 모델의 기술적 지향점을 보여준다.

실무 Takeaway

에이전트 AI 도입 시 추론 비용과 지연 시간을 줄이기 위해 Vera Rubin NVL72와 같은 전용 가속기 기반의 인프라를 고려해야 한다.
보안이 중요한 기업 환경에서는 Confidential Computing 기술을 활용하여 온프레미스에서 안전하게 frontier 모델을 운영할 수 있다.
자율 에이전트 구축 시 데이터베이스 쿼리 성능을 극대화하려면 Vera CPU와 같이 메모리 대역폭이 높은 CPU 기반의 인프라가 필수적이다.

언급된 리소스

GitHubDell Enterprise Hub on Hugging Face