fp4-qat
FP4 양자화 인식 학습
모델 학습 단계에서 4비트 부동소수점(FP4) 정밀도로 인한 오차를 미리 반영하여 학습하는 기법이다. 가중치를 매우 낮은 비트로 압축하면서도 모델의 성능 저하를 최소화하여 추론 속도와 메모리 효율을 극대화한다.
FP4 양자화 인식 학습
모델 학습 단계에서 4비트 부동소수점(FP4) 정밀도로 인한 오차를 미리 반영하여 학습하는 기법이다. 가중치를 매우 낮은 비트로 압축하면서도 모델의 성능 저하를 최소화하여 추론 속도와 메모리 효율을 극대화한다.