본문으로 건너뛰기
MXFP8 GEMM: CUDA와 PTX를 사용하여 cuBLAS 성능의 최대 99% 달성 | AI Trends