FP4 양자화 인식 학습
모델 학습 단계에서 4비트 부동소수점(FP4) 정밀도로 인한 오차를 미리 반영하여 학습하는 기법이다. 가중치를 매우 낮은 비트로 압축하면서도 모델의 성능 저하를 최소화하여 추론 속도와 메모리 효율을 극대화한다.