루프 퓨전
여러 개의 독립적인 반복문을 하나의 반복문으로 결합하여 데이터 접근 횟수를 줄이는 최적화 기법이다. 메모리 대역폭 소모를 줄이고 CPU 캐시 적중률을 높여 전체적인 처리 성능을 향상시키지만, 코드 복잡도가 높아져 인간이 직접 구현하기 까다로운 경우가 많다.