커널
GPU와 같은 가속기에서 실행되는 가장 작은 단위의 연산 프로그램이다. 행렬 곱셈 등 특정 수학적 연산을 하드웨어에 최적화하여 실행하도록 설계되며 AI 모델의 전체 성능을 결정짓는 핵심 요소이다.