LiteRT-LM
구글의 TensorFlow Lite가 리브랜딩된 런타임으로, 모바일 및 엣지 디바이스에서 LLM을 효율적으로 실행하기 위해 최적화된 추론 엔진이다. 하드웨어 가속기를 활용하여 저전력 환경에서도 모델 추론이 가능하게 한다.