본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
gpu-offload
GPU 오프로드
중급
모델의 연산 레이어를 CPU 대신 GPU 메모리에 할당하여 처리하는 기법으로, 할당량이 높을수록 추론 속도가 빨라진다.
비슷한 개념
gpu-offloading
ngl
gpu-layers
cpu-offload
inference-offloading
offload
cuda-malloc
distributed-inference
← 용어 사전 전체 보기