메모리 벽
프로세서의 연산 속도에 비해 메모리의 데이터 전송 속도가 따라가지 못해 전체 시스템 성능이 저하되는 현상이다. 특히 대규모 언어 모델의 추론 단계에서 가장 큰 성능 저하 원인으로 꼽힌다.