연산 집약도
메모리에서 읽어온 데이터 1바이트당 수행되는 부동 소수점 연산(FLOPs)의 비율로, 하드웨어의 성능 병목이 메모리인지 연산인지 판단하는 지표다.
확산 모델의 느린 추론 해결, CDLM으로 최대 14.5배 빨라진다