벌칸
하드웨어 추상화 계층이 낮은 크로스 플랫폼 그래픽 및 연산 API로, NVIDIA 외의 GPU에서 LLM을 가속할 때 주로 사용된다.
Ollama보다 빠른 Vulkan 성능? Go로 구현한 고성능 LLM 추론 엔진 dlgo
RAG의 한계를 깨는 가우시안 스플랫 기반 계층적 메모리
AMD 내장 그래픽과 NVIDIA 외장 그래픽의 완벽한 공존: MoE와 비전 모델 동시 구동법