쿠다 그래프
GPU 연산 커널들의 실행 순서를 미리 정의하여 한 번에 제출하는 기술이다. CPU가 개별 커널을 하나씩 실행할 때 발생하는 오버헤드를 줄여 전체 추론 속도를 최적화한다.