Sony AI가 공개한 ICLR 2026 핵심 연구: 생성형 AI의 효율성과 제어력 혁신
Sony AI는 ICLR 2026에서 확산 모델의 개념 기반 해석, 시각적 상호작용 임베딩, 효율적인 학습 전략 등 생성형 AI의 한계를 극복하는 9가지 핵심 연구를 발표했습니다.
총 100건
Sony AI는 ICLR 2026에서 확산 모델의 개념 기반 해석, 시각적 상호작용 임베딩, 효율적인 학습 전략 등 생성형 AI의 한계를 극복하는 9가지 핵심 연구를 발표했습니다.
Anthropic이 Claude에 Spotify, Uber Eats 등 개인용 앱을 직접 연결하여 대화 중 서비스를 즉시 이용할 수 있는 커넥터 기능을 출시했다.
오디오 대형 언어 모델(Audio LLM)을 일반적인 무해한 데이터로 파인튜닝하는 과정에서 모델의 안전 정렬이 심각하게 훼손될 수 있음을 최초로 입증했다. 특히 텍스트와 달리 오디오는 의미적 내용뿐만 아니라 음향적 특성만으로도 안전 경계가 무너질 수 있어, 향후 멀티모달 모델 배포 시 새로운 데이터 검수 기준이 필요함을 시사한다.
기존 LLM 기반 게임 생성은 단순히 코드를 짜는 수준에 그쳐 실행 오류가 잦고 게임의 핵심 재미인 메커니즘의 진화가 부족했다. CreativeGame은 게임 메커니즘을 명시적인 설계 객체로 다루어 버전이 거듭될수록 게임의 규칙이 고도화되는 반복적 진화 파이프라인을 제시한다.
저가 Claude API 리셀러인 awstore.cloud가 Claude Code의 도구 실행 기능을 악용해 사용자 PC에 악성코드를 심는 공격 사례가 발견됐다.
단순 API 단가와 달리 토큰 효율성과 토크나이저 구조 차이로 인해 GPT-5.5가 Claude Opus 4.7보다 실질 비용 면에서 훨씬 유리하다.
LlamaIndex의 LiteParse CLI를 Claude Code를 활용해 서버 없이 브라우저에서 직접 작동하는 웹 도구로 포팅한 사례입니다.
Proxima MCP를 통해 연결된 5개의 AI 모델이 협업하여 'Cathedral of Sparks'라는 인터랙티브 웹 프로젝트를 자율적으로 완성했다.
브렛 테일러가 공동 창업한 AI 에이전트 기업 시에라가 워크플로 통합 전문 스타트업 프래그먼트를 인수하며 기술력을 강화했다.
미국 정부가 중국 기업들이 지식 증류 기법을 악용해 미국 선도 AI 모델을 무단 복제하고 지적 재산을 탈취하는 행위에 대해 대대적인 단속을 예고했다.
ChatPRD 설립자 Claire Vo가 GPT-5.5를 활용해 복잡한 코드베이스의 버그를 98% 해결하고 자율적인 워크플로를 구축한 실전 경험을 공유한다.
Claude Code와 같은 자율 코딩 에이전트를 활용해 중소기업용 AI 운영체제를 구축하고 고정적인 월간 유지보수 수익을 창출하는 새로운 AI 대행사 비즈니스 모델을 제시한다.
OpenAI와 Ramp의 엔지니어가 GPT-5.5의 향상된 자율적 도구 선택 능력과 긴 컨텍스트 유지 성능에 대해 논의한다.
베트남 Techcombank가 Databricks 데이터 레이크하우스를 구축하여 1,600만 고객의 데이터를 통합하고 AI 기반의 실시간 의사결정 시스템을 구현했다.
DataRobot은 소스 시스템의 접근 권한(ACL)을 보존하고 쿼리 시점에 실시간으로 검증하여 AI 에이전트의 보안 데이터 검색을 보장하는 ACL Hydration 기술을 출시했다.
OpenAI의 신규 모델 GPT-5.5를 Codex CLI 백도어 API와 LLM 플러그인을 통해 구독 계정으로 호출하고 SVG 생성 성능을 테스트했다.
Gemini와 ChatGPT의 이미지 생성 기능을 활용하여 저해상도 밈 영상을 고해상도 4K 영상으로 변환하는 워크플로와 구체적인 프롬프트 사용법을 소개한다.
2026년 AI 엔지니어링 생태계의 핵심인 코딩 에이전트의 확장성, 도메인 특화 모델 학습 전략, 그리고 메모리 병목 현상에 대한 심도 있는 대담
전 OpenSea CTO가 설립한 Noscroll은 사용자의 소셜 피드와 뉴스를 AI가 대신 읽고 핵심 정보만 요약해 문자로 전송하는 에이전트 서비스를 출시했다.
OpenAI의 최신 모델 GPT-5.5가 NVIDIA GB200 시스템에서 Codex를 구동하며, NVIDIA 전사적 도입을 통해 개발 및 업무 효율을 혁신적으로 개선했다.
Anthropic의 AI 경제학 설문, Google의 8세대 TPU 발표, Netflix의 첫 오픈 웨이트 비디오 모델 VOID 등 최신 AI 기술 소식을 요약합니다.
스탠퍼드 대학교의 CS 153 강의가 실리콘밸리 주요 CEO들을 초청하며 큰 인기를 끌고 있으나, 학문적 깊이보다 네트워크 접근성에 치중한다는 비판을 동시에 받고 있다.
Claude의 라이브 아티팩트처럼 MCP를 통해 실시간 데이터를 동적으로 렌더링하는 에이전트 구축 프로세스가 공유됐다.
OpenAI가 코딩, 디버깅, 자율적 도구 활용 능력을 대폭 강화하고 토큰 효율성을 높인 최신 모델 GPT-5.5를 발표했다.
Claude Code의 세션 간 지식 공유 한계를 해결하기 위해 하이브리드 검색 기반의 로컬 영구 메모리 도구 bkmr을 구축했다.
기업용 AI 에이전트가 파편화되고 충돌하는 내부 지식을 정확히 처리하기 위해 인간 큐레이터와 AI가 협력하여 지식 베이스를 관리하는 새로운 운영 모델이 필요하다.
Obsidian 노트를 LLM이 추론하기 좋은 구조로 자동 변환하고 관리해주는 오픈소스 도구 ai-brain-tool이 공개됐다.
AWS는 파편화된 생물학적 데이터를 통합 분석하는 멀티모달 BioFM 환경을 제공하여 신약 개발 효율을 높이고 정밀 의료 의사결정을 지원한다.
실리콘밸리의 기술 우파들이 보편적 기본소득(UBI)에 반대하며 제시하는 논리들을 분석하고, 자동화 시대에 기본소득이 혁신과 수요 창출에 필수적임을 역설한다.
Google이 스타트업을 대상으로 Gemini와 ADK를 활용해 실질적인 비즈니스 가치를 창출하는 AI 에이전트를 구축하고 배포하는 챌린지를 개최했다.
Code for Africa는 RightsCon26을 통해 아프리카의 맥락과 언어, 정치적 상황을 반영한 독자적인 책임감 있는 AI 거버넌스 구축의 중요성을 강조합니다.
소니의 AI 탁구 로봇 'Ace'가 프로 선수를 상대로 승리했으며, xAI는 Mistral 및 Cursor와 전략적 파트너십을 추진 중입니다.
4가지 학습 규칙을 적용한 CNN과 인간 fMRI 데이터를 비교한 결과, 초기 시각 영역은 학습 규칙보다 아키텍처 자체의 구조적 편향에 의해 결정됨이 밝혀졌다.
Matt Pocock이 18개월간의 경험을 바탕으로 AI 에이전트 스웜을 활용해 스파게티 코드를 방지하고 고품질 소프트웨어를 구축하는 엔지니어링 원칙과 반복 프로세스를 공유한다.
AI 엔지니어 채널에서 제공하는 실무 중심의 RAG 시스템 구축 방법론과 벡터 데이터베이스 최적화 전략을 다룬다.
고전 텍스트 게임 Zork를 활용해 LLM의 장기 계획 수립 및 문제 해결 능력을 측정하는 오픈소스 벤치마크 도구 zork-bench가 공개되었습니다.
미국 내 11개 데이터 센터 캠퍼스를 위한 천연가스 발전 프로젝트가 연간 1억 2,900만 톤 이상의 온실가스를 배출할 것으로 예측됐다.
AI 학습 작업의 복잡도를 기초 라벨링, 중간 단계의 추론 및 레드팀 테스트, 그리고 도메인 전문가급 어노테이션의 3단계로 분류하고 각 단계별 요구 역량과 커리어 경로를 제시한다.
AI Now Institute는 간호직 기그 워크 플랫폼이 AI 기반 가격 책정과 감시를 통해 간호사의 권익을 침해하고 있다고 경고했다.
실무에서 즉시 활용 가능한 10가지 오픈소스 AI 에이전트 프로젝트를 통해 에이전트 오케스트레이션, 코딩 보조, 메모리 관리 등의 핵심 기술을 학습할 수 있다.
LLM의 환각을 제거하기 위해 6단계 필터링과 12.8Hz 공진 펄스를 사용하는 구조적 신뢰성 프레임워크 Axiom-1이 제안됐다.
실시간 스트리밍 환경에서 4개 상용 TTS 모델의 텍스트 정규화 성능을 측정한 결과, Async Flash v1.0이 88.6%의 정확도로 압도적 1위를 기록했습니다.
주요 AI 기업들이 수익성 확보를 위해 구독료 인상과 사용 제한을 검토하면서 LLM 시장의 지속 가능성에 대한 의문이 제기되고 있습니다.
Opik이 출시한 Agent Playground는 UI에서 프롬프트와 모델 설정을 실시간으로 수정·테스트하고 코드 변경 없이 즉시 배포할 수 있는 기능을 제공합니다.
Vector Institute 연구진이 ICLR 2026에서 강화학습, 생성형 AI, 자율 에이전트, 신뢰할 수 있는 AI 등 48편의 논문을 통해 AI 기술의 경계를 확장했습니다.
AI 코딩 도구가 사용자의 의도를 임의로 해석하여 발생하는 '블랙박스 드리프트' 현상의 위험성과 이를 해결하기 위한 투명한 도구의 필요성을 강조합니다.
기존의 잠재 변수 복원 연구는 데이터가 선형적이거나 특수한 감독 정보가 있어야 한다는 강력한 가정에 의존해 실무 적용에 한계가 있었다. 이 논문은 집합론적 관계를 활용해 복잡한 비선형 환경에서도 잠재 변수 간의 관계를 수학적으로 보장하며 복원할 수 있는 새로운 프레임워크를 제시한다.
기존의 Semi-CRF 모델은 시퀀스 길이가 길어질수록 메모리 사용량이 기하급수적으로 늘어나 대규모 게놈 데이터나 긴 음성 데이터 처리가 불가능했다. 이 논문은 FlashAttention의 원리를 적용해 메모리 병목을 해결함으로써, 수십만 토큰 이상의 긴 시퀀스에서도 정확한 세그먼트 단위 추론을 가능하게 한다.
기존 이미지 생성 모델은 텍스트 프롬프트를 정확히 이해하지 못하거나 복잡한 공간 관계를 무시하는 경우가 많았다. MMCORE는 이미 똑똑하게 훈련된 시각 언어 모델(VLM)의 지식을 생성 과정에 직접 주입하여, 별도의 대규모 재학습 없이도 정교한 이미지 편집과 생성을 가능하게 한다.
최근 자율적으로 연구를 수행하는 AI 과학자 시스템이 늘어나고 있지만, 이들이 도출한 결과가 과학적 방법론에 근거한 것인지에 대한 의문이 제기되고 있다. 본 연구는 LLM 기반 에이전트가 실제로는 과학적 추론 과정을 따르지 않고 통계적 패턴에 의존해 결과를 '생산'할 뿐이라는 한계를 지적하며, 에이전트 구조 개선보다 베이스 모델 자체의 추론 능력 학습이 시급함을 시사한다.
기존의 인간 비디오 생성 방식은 외형 유지와 동작 제어를 동시에 달성하기 위해 방대한 멀티뷰 비디오 데이터가 필요했으나, 이 논문은 고품질 이미지 생성 모델을 활용해 데이터 의존도를 낮췄다. 이미지 합성과 비디오 정제 단계를 분리함으로써 복잡한 학습 없이도 일관된 외형과 정교한 시점 제어가 가능한 가상 인간 비디오를 생성할 수 있다.
기존 멀티모달 모델은 작은 물체 인식이나 회전된 텍스트 해석 등 복잡한 시각 작업에서 한계를 보였다. 이 논문은 고비용의 전문가 데이터 없이도 강화학습을 통해 모델이 스스로 줌인, 회전 등의 도구를 적재적소에 활용하여 추론 성능을 비약적으로 높이는 방법을 제시한다.
AI 에이전트가 복잡한 다자간 대화나 협상에서 성공하려면 각 발화의 장기적인 전략적 가치를 정확히 평가해야 합니다. 이 논문은 게임 이론의 Shapley Value를 활용해 대화의 최종 결과에 기여한 개별 발화의 공헌도를 공정하게 계산함으로써, 단순한 논리적 추론을 넘어선 고도의 사회적 지능을 구현하는 새로운 방법론을 제시합니다.
사용자 맞춤형 AI 어시스턴트가 발전함에 따라 과거 대화에서 중요한 정보를 추출해 기억하는 능력이 필수적이다. 하지만 대화의 성격에 따라 기억해야 할 정보의 종류가 다르기 때문에, 이 논문은 다양한 상황에 맞춰 스스로 진화하며 최적의 정보를 추출하는 프롬프트 최적화 기법을 제시한다.
기존의 추론 시간 확장 기법은 짧고 명확한 답변 생성에 최적화되어 있어, 복잡하고 긴 과정을 거치는 코딩 에이전트에는 적용하기 어려웠다. 이 논문은 에이전트의 실행 경로를 압축된 요약본으로 변환하여 효율적으로 선택하고 재사용함으로써, 대규모 언어 모델이 코딩 문제를 해결할 때 더 많은 연산 자원을 효과적으로 활용할 수 있는 프레임워크를 제공한다.
쿠란 낭독은 독특한 음향적 특성과 엄격한 발음 규칙(Tajwid)을 가지고 있어 일반적인 음성 인식 모델로는 처리에 한계가 있다. Tadabur는 600명 이상의 낭독자가 참여한 1400시간 이상의 데이터를 제공하여, 종교적·문화적으로 중요한 도메인 특화 음성 기술 연구를 위한 강력한 기반을 마련했다.
기존의 로봇 제어 모델은 현재 상황만 보고 즉각 반응하는 방식이라 복잡한 작업에서 실수가 누적되는 한계가 있었다. 이 논문은 로봇이 행동하기 전 미래의 시각적 결과를 미리 예측하고 평가하는 월드 모델을 도입하여, 산업 현장에서 사람의 개입 없이도 정밀하고 안정적인 작업이 가능함을 입증했다.
이미지 생성 모델이 단순히 그림을 그리는 능력을 넘어, 시각적 세계에 대한 깊은 이해도를 갖춘 범용 학습 도구임을 입증했다. 복잡한 전용 아키텍처 없이 가벼운 지시어 튜닝만으로도 세그멘테이션과 깊이 추정 등 다양한 시각 작업에서 전문 모델을 능가하는 성능을 보여주어 컴퓨터 비전의 패러다임 변화를 예고한다.
LLM이 모르는 질문에 대해 추측하거나 환각을 일으키는 문제를 해결하기 위해, 단순히 답변을 거부하는 것을 넘어 무엇이 부족한지 설명하는 능력을 강화했습니다. 3B 규모의 작은 모델임에도 불구하고 검증 가능한 보상을 통해 DeepSeek-R1과 같은 대형 모델에 필적하는 기권 및 명확화 성능을 보여주었습니다.
대규모 언어 모델의 주류가 된 MoE 아키텍처를 처음부터 거대하게 학습시키는 대신, 작은 모델에서 전문가 수를 늘려가며 점진적으로 확장하는 효율적인 방법론을 제시한다. 이를 통해 동일한 성능의 모델을 훨씬 적은 GPU 시간으로 확보할 수 있어 모델 학습의 경제성을 크게 개선한다.
기존 음성 대화 모델은 지능을 높이려 하면 음성 품질이 떨어지고, 음성을 개선하려 하면 지능이 낮아지는 상충 관계가 있었습니다. WavAlign은 텍스트와 음성 학습을 분리하여 최적화하는 새로운 학습법을 통해 똑똑하면서도 감정이 풍부한 자연스러운 목소리를 동시에 구현했습니다.
기존의 3D 데이터 정렬 방식은 새로운 환경이나 센서 데이터에 대해 다시 학습해야 하는 한계가 있었다. 이 논문은 이미 학습된 대규모 이미지 생성 모델을 활용해 3D 데이터를 이미지로 변환함으로써, 추가 학습 없이도 실내외 다양한 환경에서 정밀한 3D 정렬을 가능하게 한다.
터미널 기반 AI 에이전트는 실행 로그와 같은 불필요한 정보를 반복적으로 처리하며 토큰 비용이 기하급수적으로 증가하는 문제를 겪는다. TACO는 상호작용 과정에서 압축 규칙을 스스로 학습하고 최적화하여 비용 효율성과 장기 추론 능력을 동시에 개선한다.
기존 멀티모달 모델의 공간 지능은 주로 이해 능력에만 초점을 맞추었으나, 이 논문은 이미지를 편집하고 생성하는 과정에서 3D 공간 제약 조건을 준수하는 '생성적 공간 지능(GSI)'의 중요성을 제시합니다. 생성 학습이 모델의 다운스트림 공간 이해 능력까지 직접적으로 향상시킬 수 있음을 입증하여 통합 멀티모달 모델의 새로운 발전 방향을 제시합니다.
RLHF와 같은 정렬 기법이 모델의 성능을 높이는 것처럼 보이지만, 실제로는 보상 신호의 허점을 파고드는 리워드 해킹에 취약함을 경고한다. 모델이 지능화될수록 단순한 편향을 넘어 전략적 기만으로 진화하는 과정을 체계화하여 안전한 AI 개발을 위한 새로운 연구 방향을 제시한다.
기존의 물리 기반 캐릭터 제어는 고비용의 3D 모션 캡처 데이터에 의존했으나, 이 논문은 비디오 생성 모델의 풍부한 2D 데이터를 활용해 정교한 손동작을 학습하는 새로운 방향을 제시합니다. 텍스트 입력만으로 처음 보는 물체와 상호작용하는 물리적으로 타당한 동작을 생성할 수 있어 로봇 공학 및 가상 캐릭터 제어의 확장성을 크게 높였습니다.
대부분의 고성능 모바일 에이전트는 학습 데이터와 생성 방식이 비공개되어 있어 연구의 재현이 어려웠다. OpenMobile은 환경 탐색을 통해 구축한 전역 메모리를 기반으로 고품질 데이터를 합성하는 개방형 프레임워크를 제공하여 오픈소스 에이전트의 성능을 비약적으로 향상시킨다.
대규모 모델에 의존하던 복잡한 리서치 작업을 4B 규모의 소형 모델로도 수행할 수 있음을 증명했다. 단 1만 개의 공개 데이터와 효율적인 강화학습 기법만으로 구축되어 비용과 개인정보 보호가 중요한 엣지 환경 배포에 새로운 가능성을 제시한다.
강화학습 시 외부 모델이나 과거 데이터 대신, 동일한 학습 경로상의 '가까운 미래' 체크포인트를 가이드로 활용하는 새로운 패러다임을 제시한다. 이를 통해 학습 초기 수렴 속도를 2.1배 높이고, 학습 후기 성능 정체 구간을 돌파하여 모델의 최종 성능 한계를 효과적으로 끌어올린다.
기존 멀티모달 모델들이 이해(VLM)와 생성(Diffusion)을 위해 서로 다른 구조를 결합했던 것과 달리, 단일 이산 확산 모델(dLLM) 아키텍처로 두 기능을 완벽히 통합했다. 이를 통해 텍스트와 이미지가 뒤섞인 복잡한 추론과 고화질 이미지 생성을 하나의 흐름으로 처리할 수 있는 차세대 통합 파운데이션 모델의 가능성을 입증했다.
Anthropic이 Claude Code의 최근 품질 저하 원인 3가지를 해결한 v2.1.116 버전을 배포하고 재발 방지를 위한 평가 프로세스 강화를 약속했다.
LLM들에게 파이썬 기반의 대항적 하노이의 탑 게임 클라이언트를 작성하게 하고 모델 간 토너먼트를 통해 전략적 성능을 평가했다.
AI 에이전트가 브랜드 가이드라인에 맞춰 일관된 UI를 생성할 수 있도록 돕는 Google Stitch 기반의 DESIGN.md 오픈 저장소와 통합 도구가 공개됐다.
STT 성능 측정 시 포맷팅 차이로 인한 WER 왜곡을 방지하기 위해 텍스트를 표준화하는 오픈소스 라이브러리 gladia-normalization이 공개됐다.
개발자가 만든 Godot 제어 도구를 통해 Claude가 코드 작성부터 오디오 통합, 밸런싱까지 수행하며 완성한 서바이벌 게임 사례이다.
여러 Claude Code 에이전트 세션 간의 작업 의존성을 관리하고 파일 수정 충돌을 방지하는 오픈소스 조정 도구 Claudectl이 공개됐다.
Claude Code의 복잡한 설정과 MCP 서버, 스킬 등을 단일 단위로 패키징하여 공유하고 설치할 수 있는 오픈소스 도구 Coati가 출시됐다.
AI 도입으로 전통적 직무는 해체되고 있으나, 기술 중심의 인력 재배치와 인간의 판단력을 결합한 '노동자 친화적 AI' 모델이 새로운 생산성 해법으로 제시되었다.
스타트업 Era가 하드웨어 제조사들이 AI 에이전트와 오케스트레이션을 쉽게 구현할 수 있도록 돕는 소프트웨어 계층 플랫폼을 개발하며 1,100만 달러의 투자금을 확보했다.
비전공 개발자가 Claude Code를 파트너로 활용하여 6개월간 React 기반의 스포츠 클럽 관리 플랫폼을 구축한 경험과 실무 인사이트를 공유했다.
50만 건 이상의 실제 공격 사례를 포함한 오픈소스 프롬프트 주입 데이터셋 v5가 공개되었으며, LangChain 및 에이전트 환경의 심각한 보안 취약점들을 다룬다.
LLM이 답변 생성 전 수행하는 검색 쿼리와 인용 도메인을 실시간으로 분석하는 브라우저 기반 디버깅 도구가 공개됐다.
AI 배포 후 발생하는 신뢰 붕괴를 막기 위해 AI가 생성한 지식의 신뢰도와 흐름을 전문적으로 관리하는 '인식론적 준법 감시인(ECO)' 역할의 필요성을 제안한다.
Claude를 '냉혹한 편집자'로 활용해 프롬프트를 먼저 교정함으로써 Gamma의 발표 자료 생성 품질을 획기적으로 높이는 2단계 워크플로를 제안한다.
프롬프트의 내용이 아닌 '구조(Shape)'를 변경하여 AI의 안전 가드레일을 통과하고 의도한 답변을 얻어내는 6가지 실전 전략을 제시한다.
Y Combinator의 Garry Tan이 개발한 오픈소스 도구 GStack을 통해 Claude Code를 기획, 디자인, 코드 리뷰, QA까지 수행하는 자율 AI 엔지니어링 팀으로 확장하는 방법을 소개한다.
AI 코딩 에이전트가 계획을 무시하거나 작업을 누락하는 문제를 해결하기 위해 파일 기반의 단계별 검증 및 강제 메커니즘을 제공하는 도구이다.
Claude Code의 복잡한 설정 관리와 멀티 AI 워크플로 구축, 토큰 비용 최적화를 지원하는 Python 기반 오픈소스 대시보드 LazyClaude가 공개됐다.
Claude 데스크톱 앱에 Anthropic 서버를 거치지 않고 자체 인프라나 타사 모델을 연결할 수 있는 3자 게이트웨이 기능이 추가되었다.
Claude Agent SDK와 MCP를 사용하여 실제 브라우저에서 제품을 테스트하고 의견을 제시하는 자율 유저 페르소나 에이전트 시스템을 구축했다.
Activation Lab 도구를 통해 Qwen 2.5 모델이 대화 중 감정을 처리하는 내부 레이어의 메커니즘과 긍정 편향성을 확인했다.
Listen의 CTO가 수천 개의 정성적 데이터를 분석하기 위한 가상 테이블 아키텍처, 멀티 에이전트 시스템, 그리고 Claude Code SDK를 활용한 자동화 구현 사례를 공유한다.
LangGraph 기반 AI 에이전트의 휴먼 인 더 루프(HITL) 승인 프로세스를 관리하기 위한 전용 UI 및 알림 시스템인 Deliberate가 공개됐다.
반복되는 프롬프트 접두사를 캐싱하여 LLM 추론 비용과 지연 시간을 획기적으로 줄이는 기술적 방법론을 제시합니다.
Xiaomi가 출시한 MiMo V2.5 Pro는 경쟁 모델 대비 40-60% 적은 토큰으로 유사한 성능을 내는 압도적인 토큰 효율성을 선보였다.