본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
K-양자화 (k-quants) 용어 설명 | AI Trends
k-quants
K-양자화
고급
가중치를 특정 블록 단위로 나누어 서로 다른 비트 수준을 할당하는 최적화 기법이다. 로컬 LLM 구동 환경에서 효율적인 메모리 관리를 위해 널리 사용된다.
비슷한 개념
gptq
1-bit-llm
kv-cache-quantization
one-bit-quantization
int-8-quantization
fp8-quantization
quantization
awq-quantization
← 용어 사전 전체 보기