커널 저작
GPU에서 실행되는 가장 작은 연산 단위인 커널을 직접 프로그래밍하는 과정이다. 표준 라이브러리에서 제공하지 않는 특수한 연산을 구현하거나 하드웨어 성능을 극한으로 끌어올릴 때 필요하다.