이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.
핵심 요약
Liquid AI가 28T 토큰 학습과 강화학습을 통해 도구 사용 및 데이터 추출 성능을 극대화한 350M 규모의 초소형 모델 LFM2.5-350M을 발표했다.
배경
Liquid AI가 데이터 추출 및 도구 사용 성능을 극대화한 350M 파라미터 규모의 초소형 언어 모델 LFM2.5-350M을 출시하여 이를 공유했다.
의미 / 영향
초소형 모델에서도 방대한 데이터 학습과 강화학습 최적화를 통해 고성능 에이전트 기능을 구현할 수 있음이 확인됐다. 이는 클라우드 의존도를 낮추고 온디바이스 AI 환경에서 복잡한 도구 사용 자동화를 실현하는 데 중요한 이정표가 된다.
실용적 조언
- 양자화된 GGUF 또는 Hugging Face 체크포인트를 사용하여 모바일이나 CPU 환경에서 가벼운 에이전트 워크플로우를 테스트할 수 있다.
섹션별 상세
LFM2.5-350M은 350M 파라미터라는 초소형 크기에도 불구하고 데이터 추출과 도구 사용 성능을 극대화하도록 설계됐다. 28T 토큰이라는 방대한 데이터셋으로 사전 학습을 진행하고 확장된 강화학습(scaled RL)을 적용하여 모델의 신뢰성을 높였다. 양자화 시 500MB 미만의 용량으로 작동하여 연산 자원과 메모리가 극도로 제한된 환경에서도 효율적인 추론이 가능하다. 이는 모바일 기기나 엣지 컴퓨팅 환경에서 에이전트 워크플로우를 구현하는 데 적합한 특성이다.
벤치마크 결과에서 LFM2.5-350M은 자신보다 파라미터 수가 더 많은 Qwen3.5-0.8B 모델을 대부분의 지표에서 앞서는 성능을 기록했다. 함수 호출과 구조화된 출력의 일관성을 확보하여 실무적인 에이전트 루프 구성이 가능하도록 최적화가 이루어졌다. GPQA Diamond, IFBench, BFCLv4 등 주요 벤치마크에서 기존 LFM2-350M 모델 대비 비약적인 성능 향상을 이뤄냈음이 차트를 통해 확인됐다. CPU, GPU뿐만 아니라 모바일 하드웨어에서도 낮은 지연 시간으로 실행될 수 있는 범용성을 갖췄다.

실무 Takeaway
- LFM2.5-350M은 350M 파라미터 규모로 양자화 시 500MB 미만의 메모리만 점유하여 저사양 기기에서도 에이전트 기능을 수행할 수 있다.
- 28T 토큰 학습과 Scaled RL 기법을 통해 Qwen3.5-0.8B 등 더 큰 규모의 모델보다 우수한 벤치마크 성적을 거두었다.
- 데이터 추출, 함수 호출, 구조화된 출력 생성에 특화되어 있어 제한된 환경에서의 에이전트 워크플로우 구축에 최적화되어 있다.
언급된 도구
LFM2.5-350M추천
데이터 추출 및 도구 사용을 위한 초소형 언어 모델
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
원문 발행 2026. 04. 01.수집 2026. 04. 01.출처 타입 REDDIT
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.