본문으로 건너뛰기

monokernel

모노커널

중급

전체 추론 경로를 하나의 지속적인 GPU 프로그램으로 실행하는 런타임 방식. 커널 경계와 호스트 측 스케줄링 오버헤드를 제거하여 추론 속도를 극대화한다.