에너지 드리프트
양자화 이후 활성화 값의 통계적 분포나 에너지가 원래의 부동 소수점 모델과 달라지는 현상입니다. 이는 모델의 출력값이 불안정해지거나 성능이 저하되는 주요 원인이 됩니다.
VLA 모델 메모리 70% 절감, 성능은 원본 초과? QuantVLA의 혁신