본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
NVFP4 양자화 (nvfp4-quantization) 용어 설명 | AI Trends
nvfp4-quantization
NVFP4 양자화
고급
NVIDIA의 4비트 부동소수점 형식을 사용하여 모델 가중치를 압축하는 기술이다. 성능 저하를 최소화하면서 메모리 사용량과 추론 비용을 획기적으로 줄여준다.
비슷한 개념
nf4-quantization
fp4-qat
nvfp4
int4-quantization
fp8-quantization
quantization
int-8-quantization
mxfp4
← 용어 사전 전체 보기