본문으로 건너뛰기
PyTorch와 Nebius, NVIDIA B200 클러스터에서 DeepSeek-V3 MoE 모델 학습 최적화 | AI Trends