본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
NVFP4 양자화 (nvfp4-quantization) 용어 설명 | AI Trends
nvfp4-quantization
NVFP4 양자화
고급
NVIDIA의 4비트 부동소수점 형식을 사용하여 모델 가중치를 압축하는 기술이다. 성능 저하를 최소화하면서 메모리 사용량과 추론 비용을 획기적으로 줄여준다.
비슷한 개념
nf4-quantization
nvfp4
int4-quantization
fp8-quantization
quantization
mxfp4
fp8-distillation
fp4
← 용어 사전 전체 보기