Memla
소형 언어 모델이 복잡한 작업을 더 정확하고 빠르게 수행할 수 있도록 돕는 최적화 런타임이다. 작업을 작은 단위로 쪼개고 실행 가능한 형태로 변환하여 모델의 추론 오류를 줄이는 역할을 한다. 로컬 환경에서 저사양 하드웨어로 고성능 AI 기능을 구현하는 데 필수적인 도구이다.