본문으로 건너뛰기

피드 트렌딩 커뮤니티 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 커뮤니티 공지

피드 트렌딩 커뮤니티 공지

8비트 양자화 (int-8-quantization) 용어 설명 | AI Trends

int-8-quantization

8비트 양자화

중급

모델의 가중치를 32비트 부동 소수점에서 8비트 정수로 변환하여 모델 크기를 줄이고 추론 속도를 높이는 최적화 기법이다. 메모리 사용량을 대폭 절감하면서도 성능 하락을 최소화하는 것이 핵심이다.

비슷한 개념

fp8-quantization int8 quantization int8-quantization w8a8-quantization fp8-training fp8 int4-quantization

← 용어 사전 전체 보기