중요도 행렬 보정
양자화 과정에서 활성화 통계를 기반으로 각 텐서의 중요도를 계산하여 정밀도를 할당하는 기법입니다. 특히 1.7B와 같은 소형 모델에서 양자화로 인한 성능 저하를 방지하는 데 핵심적인 역할을 합니다.