동적 양자화 인식 학습
모델 가중치를 낮은 비트(INT8/INT4)로 변환하면서도 품질 저하를 최소화하기 위해 학습 과정에서 양자화 효과를 시뮬레이션하는 기법이다. 이를 통해 메모리 사용량을 획기적으로 줄이면서 고해상도 품질을 유지할 수 있다.
스마트폰에서 0.5초 만에 4K 이미지 생성? 구글 나노-바나나 2의 혁신