본문으로 건너뛰기
monokernel
모노커널
중급
전체 추론 경로를 하나의 지속적인 GPU 프로그램으로 실행하는 런타임 방식. 커널 경계와 호스트 측 스케줄링 오버헤드를 제거하여 추론 속도를 극대화한다.
비슷한 개념
cuda-graph
kernel-fusion
kernel-optimization
megakernel
fused-kernel
persistent-kernel
distributed-inference
dedicated-model-inference
← 용어 사전 전체 보기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지