2025년 말 오픈 소스 AI 생태계의 주요 성과와 신규 모델 분석

핵심 요약

2025년 연말, 오픈 소스 AI 생태계는 NVIDIA의 Nemotron-3-Nano, Arcee의 Trinity-Mini, Zhipu의 GLM-4.7 등 강력한 모델들이 출시되며 활기를 띠었다. 특히 NVIDIA는 Mamba2-Transformer 아키텍처에 MoE를 결합한 혁신적인 구조를 선보였으며, Zhipu의 GLM-4.7은 코딩 및 디자인 영역에서 상용 모델에 필적하는 성능을 입증했다. 이러한 흐름은 2026년에도 이어져 더 큰 규모의 모델과 멀티 토큰 예측(MTP) 기술의 도입이 가속화될 전망이다.

배경

MoE(Mixture of Experts) 아키텍처에 대한 기본 이해, LLM 벤치마크 지표(GPQA, SWE-bench 등)에 대한 지식

대상 독자

오픈 소스 LLM을 활용하거나 연구하는 AI 엔지니어 및 개발자

의미 / 영향

오픈 소스 모델이 특정 도메인(코딩, 디자인)에서 상용 모델의 성능을 빠르게 추격함에 따라, 기업들의 모델 선택지가 넓어지고 구축 비용이 절감될 것이다.

섹션별 상세

NVIDIA는 Nemotron-3-Nano-30B-A3B 모델을 통해 Mamba2-Transformer 하이브리드 아키텍처와 MoE를 결합한 기술력을 과시했다. 이 모델은 대부분의 학습 데이터를 공개하여 투명성을 높였으며, 2026년 상반기에는 Latent MoE와 멀티 토큰 예측(MTP) 기술을 적용한 100B 및 500B 규모의 후속 모델 출시를 예고했다. 특히 MTP 기술은 추론 속도와 효율성을 획기적으로 개선할 것으로 기대된다.

Zhipu AI의 GLM-4.7은 학술적 벤치마크보다 실제 디자인 및 코딩 작업에서 탁월한 성능을 발휘하며 주목받고 있다. DesignArena 평가에서 Claude Opus 4.5와 대등한 수준의 결과물을 생성하며, 특히 웹사이트 UI 생성 분야에서는 독보적인 품질을 보여준다. 다만 100K 토큰 이상의 긴 문맥에서는 성능이 저하되는 경향이 있으며 텍스트 중심의 모델이라는 제약이 존재한다.

Arcee AI는 Nano와 Mini라는 두 가지 MoE 모델을 출시하며 미국 내 오픈 모델 생태계의 입지를 강화하고 있다. LLM360 프로젝트는 K2-V2 모델을 통해 12T 토큰에 달하는 방대한 학습 데이터와 체크포인트를 모두 공개하며 진정한 의미의 오픈 소스 AI를 지향한다. 이러한 움직임은 모델의 성능뿐만 아니라 데이터의 투명성과 재현 가능성을 중시하는 연구 커뮤니티에 큰 기여를 하고 있다.

DeepSeek은 DSA(Dual-Pipe Sequential Attention)를 통합한 V3.2 업데이트를 통해 수학 및 코딩 경진대회 수준의 성능을 달성했다. ServiceNow는 GSPO(Generalized Stepwise Policy Optimization) 기법을 활용해 모델의 답변 길이를 최적화하면서도 성능을 유지하는 Apriel-1.6 시리즈를 공개했다. 이는 모델의 지능뿐만 아니라 실제 사용 환경에서의 효율성을 개선하려는 업계의 노력을 반영한다.