스칼라 양자화
부동 소수점 데이터를 정수로 변환하여 데이터 크기를 줄이는 기법이다. float32 데이터를 특정 범위의 int8로 매핑하여 메모리 사용량을 1/4로 절감하며, 추론 시 역양자화를 통해 원래 값에 근사하게 복원한다. 대규모 벡터 데이터를 로컬 환경에서 효율적으로 관리하기 위한 핵심 기술이다.