본문으로 건너뛰기
NVIDIA B200에서 MXFP8 및 NVFP4 양자화를 활용한 확산 모델 추론 가속화 | AI Trends