Liquid AI, 350M 파라미터 규모의 에이전트 루프 최적화 모델 LFM2.5-350M 출시

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

Liquid AI가 28T 토큰 학습과 강화학습을 통해 도구 사용 및 데이터 추출 성능을 극대화한 350M 규모의 초소형 모델 LFM2.5-350M을 발표했다.

배경

Liquid AI가 데이터 추출 및 도구 사용 성능을 극대화한 350M 파라미터 규모의 초소형 언어 모델 LFM2.5-350M을 출시하여 이를 공유했다.

의미 / 영향

초소형 모델에서도 방대한 데이터 학습과 강화학습 최적화를 통해 고성능 에이전트 기능을 구현할 수 있음이 확인됐다. 이는 클라우드 의존도를 낮추고 온디바이스 AI 환경에서 복잡한 도구 사용 자동화를 실현하는 데 중요한 이정표가 된다.

실용적 조언

양자화된 GGUF 또는 Hugging Face 체크포인트를 사용하여 모바일이나 CPU 환경에서 가벼운 에이전트 워크플로우를 테스트할 수 있다.

섹션별 상세

LFM2.5-350M은 350M 파라미터라는 초소형 크기에도 불구하고 데이터 추출과 도구 사용 성능을 극대화하도록 설계됐다. 28T 토큰이라는 방대한 데이터셋으로 사전 학습을 진행하고 확장된 강화학습(scaled RL)을 적용하여 모델의 신뢰성을 높였다. 양자화 시 500MB 미만의 용량으로 작동하여 연산 자원과 메모리가 극도로 제한된 환경에서도 효율적인 추론이 가능하다. 이는 모바일 기기나 엣지 컴퓨팅 환경에서 에이전트 워크플로우를 구현하는 데 적합한 특성이다.

벤치마크 결과에서 LFM2.5-350M은 자신보다 파라미터 수가 더 많은 Qwen3.5-0.8B 모델을 대부분의 지표에서 앞서는 성능을 기록했다. 함수 호출과 구조화된 출력의 일관성을 확보하여 실무적인 에이전트 루프 구성이 가능하도록 최적화가 이루어졌다. GPQA Diamond, IFBench, BFCLv4 등 주요 벤치마크에서 기존 LFM2-350M 모델 대비 비약적인 성능 향상을 이뤄냈음이 차트를 통해 확인됐다. CPU, GPU뿐만 아니라 모바일 하드웨어에서도 낮은 지연 시간으로 실행될 수 있는 범용성을 갖췄다.

LFM2.5-350M 모델과 타사 소형 모델들의 6개 주요 벤치마크 성능 비교 차트이다. — ChartGPQA Diamond, IFBench, BFCLv4 등 모든 지표에서 LFM2.5-350M이 LFM2-350M, Granite-350M, Gemma 3 1B, Qwen3.5-0.8B를 상회하는 결과를 나타낸다. 특히 IFBench와 CaseReportBench에서 타 모델 대비 2배 이상의 성능 우위를 기록하며 도구 사용 및 데이터 추출 능력을 입증했다.

실무 Takeaway

LFM2.5-350M은 350M 파라미터 규모로 양자화 시 500MB 미만의 메모리만 점유하여 저사양 기기에서도 에이전트 기능을 수행할 수 있다.
28T 토큰 학습과 Scaled RL 기법을 통해 Qwen3.5-0.8B 등 더 큰 규모의 모델보다 우수한 벤치마크 성적을 거두었다.
데이터 추출, 함수 호출, 구조화된 출력 생성에 특화되어 있어 제한된 환경에서의 에이전트 워크플로우 구축에 최적화되어 있다.

언급된 도구

LFM2.5-350M추천

데이터 추출 및 도구 사용을 위한 초소형 언어 모델

언급된 리소스

문서Liquid AI Blog - LFM2.5-350M: No Size Left Behind

문서Hugging Face - LiquidAI/LFM2.5-350M