최소자승법
데이터의 잔차 제곱합을 최소화하여 최적의 해를 구하는 통계적/대수적 기법이다. 이 아티클에서는 복잡한 딥러닝 학습 대신 이 기법을 사용하여 KV 캐시 압축 속도를 획기적으로 높였다.
LLM 비용 90% 절감의 열쇠? MIT가 공개한 50배 압축 기술