aiter
AMD ROCm 환경에서 머신러닝 워크로드를 가속하기 위해 설계된 고성능 AI 연산 라이브러리이다. Triton이나 CK 기반의 최적화된 커널을 제공하여 하드웨어 효율을 최대한 끌어낸다.
AMD GPU 최적화로 LLM 추론 성능 2배 높이고 비용은 절반으로