본문으로 건너뛰기
kernel-anvil: 모델 형상별 커널 자동 튜닝으로 AMD GPU에서 llama.cpp 추론 속도 2배 향상 | AI Trends