엔비디아 추론 전송 라이브러리
분산 추론 환경에서 노드 간 효율적인 점대점(Point-to-Point) 데이터 전송을 위해 설계된 라이브러리이다. GPU 메모리, CPU 메모리, 스토리지 간의 데이터 이동을 추상화하며 RDMA를 통한 고속 KV 캐시 공유를 지원한다.