중요도 행렬
양자화 과정에서 각 가중치가 모델 성능에 미치는 중요도를 계산하여 반영하는 기술이다. 이를 통해 저비트 양자화에서도 핵심적인 정보 손실을 방지하여 성능 저하를 최소화한다.
Qwen3.5 GGUF 성능 극대화: Unsloth의 새로운 양자화 알고리즘 공개
MXFP4 양자화, 모델에 따라 성능 차이 극명하다