본문으로 건너뛰기
llama.cpp에 NVFP4 지원 도입: Blackwell GPU 사용자들을 위한 2.3배 속도 향상과 메모리 절감 | AI Trends