1비트 LLM
모델의 가중치를 1비트(0 또는 1)로 표현하는 극단적인 양자화 기술이다. 메모리 사용량을 획기적으로 줄여 저사양 기기에서도 대형 모델을 실행할 수 있게 하며, 하드웨어 효율성을 극대화하는 데 중요하다.