본문으로 건너뛰기
Intel Arc B580에서 llama.cpp Vulkan 사용 시 194k 토큰 프롬프트 처리 속도 저하 문제 | AI Trends