NVIDIA Dynamo
대규모 추론 워크로드를 최적화하기 위한 NVIDIA의 도구. Mixture-of-Experts(MoE) 모델을 포함한 복잡한 모델을 효율적으로 서빙하도록 지원한다.