커널 최적화
GPU와 같은 하드웨어 가속기에서 실행되는 가장 낮은 수준의 연산 단위인 커널의 실행 속도와 메모리 효율을 극대화하는 작업이다. 모델의 추론 속도와 처리량을 결정짓는 핵심적인 엔지니어링 영역이다.