모델 압축
AI 모델의 크기를 줄여 적은 메모리와 연산량으로도 실행 가능하게 만드는 기법이다. 양자화 등을 통해 가중치를 낮은 정밀도로 변환하며, 온디바이스 배포와 추론 비용 절감에 필수적이다.
거대 모델을 절반 크기로 양자 기술로 무장한 유럽발 소버린 AI의 역습
애플 시리 개편 또 연기... 구글 제미나이 탑재한 '캄포' 준비 중