본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 탐색 보관함 커뮤니티

홈 트렌딩 탐색 보관함 프로필

양자화 기법 (gptq) 용어 설명 | AI Trends

gptq

양자화 기법

중급

LLM의 가중치를 4비트 등으로 압축하여 모델 크기와 메모리 사용량을 대폭 줄이는 포스트 트레이닝 양자화 기술이다. 96GB VRAM 환경에서 122B와 같은 거대 모델을 구동하기 위해 필수적인 최적화 방식이다.

비슷한 개념

1-bit-llm kv-cache-quantization k-quants low-rank-quantization qlora quantization nf4-quantization fp8-quantization

← 용어 사전 전체 보기