L3 캐시
프로세서 내부의 고속 메모리 계층 중 하나로, 메인 메모리보다 빠르지만 용량은 작다. 대량의 데이터를 처리할 때 캐시 적중률을 높이면 연산 지연 시간을 획기적으로 줄일 수 있다.
GPU L3 캐시 용량에 ubatch-size를 맞추니 추론 속도 10배 상승