rocBLAS
AMD GPU에서 기본 선형 대수 연산(BLAS)을 수행하기 위한 차세대 라이브러리이다. NVIDIA의 cuBLAS에 대응하며, AMD 하드웨어에서 딥러닝 모델의 행렬 연산을 가속화하여 llama.cpp와 같은 엔진이 AMD GPU를 인식하고 활용할 수 있도록 돕는다.