Qwen3.5-35B에서 드러난 Expert 114 경험적 축
Qwen3.5-35B의 MoE에서 전문가 114가 반성적·내적 관점 서술에서 강한 활성 신호를 보였다.
총 69건
Qwen3.5-35B의 MoE에서 전문가 114가 반성적·내적 관점 서술에서 강한 활성 신호를 보였다.
PTZ 카메라와 드론 영상을 MediaMTX로 중계해 2초마다 프레임을 RF-DETR에 전송하고 ByteTrack·PolygonZone으로 침입을 확인해 자동으로 드론을 출동시킨다.
NVIDIA는 OpenUSD와 Omniverse 기반 합성 데이터와 Metropolis의 에이전트 스킬을 통해 엣지 비디오를 운영 인사이트로 전환하는 반복 가능한 학습·배포 워크플로를 제시한다.
Zapier MCP를 통해 Claude 에이전트가 9,000개 이상의 앱과 직접 연동되어 CRM 관리부터 결제까지 비즈니스 전반을 자동화하는 워크플로와 한계를 다룬다.
Lovelace의 Elemental은 테이블·PDF·뉴스·JSON·위성영상 등 다양한 데이터를 공통 중간 표현으로 변환해 에이전트가 탐색 가능한 컨텍스트 그래프를 자동으로 구축하고 유지한다.
OpenAlex와 arXiv의 약 1100만 논문을 SPECTER 2 임베딩으로 인코딩하고 UMAP으로 2차원에 투영해 보로노이 기반 인터랙티브 연구 지도를 만든 프로젝트이다.
연구에서 관리자들은 'AI 직원'으로 귀속된 작업에서 오류를 18% 더 적게 발견했고, 스트라토스피어 기반 HAPS가 18km 고도에서 5G 보강 시험을 준비하고 있다.
LIMEN은 은닉 상태 궤적의 기하와 이산적 전이에서 보편적 전이 모티프와 맥락 의존적 동적 변화를 규명했다.
AI 에이전트가 코드베이스를 정확히 이해하고 스스로 수정할 수 있도록 돕는 코드베이스 하네스 개념과 Skill 라이브러리 활용법을 소개합니다.
작성자는 norm-preserving biprojection을 적용해 Qwen3.6-35B-A3B에서 거부 방향을 제거하면서 벤치마크 저하 없이 보류된 테스트에서 거부율을 0%로 만들었다.
구글·OpenAI·NVIDIA 등 글로벌 테크 기업이 취리히에 밀집해 있으며 이 지역은 높은 특허·R&D 투자와 딥테크 중심의 벤처 자본 구조를 보인다.
browser-search는 SearXNG, Camofox, CloakBrowser를 결합해 에이전트의 웹 검색과 브라우징을 자체 호스팅으로 처리하며 Readability.js로 토큰 사용을 크게 절감한다.
Physical AI의 최신 기술 스택과 시스템 관점을 정리한 신간 소개와 함께, 로봇이 학습하고 판단하며 행동하는 기술적 흐름을 조망한다.
LangChain 기반 에이전트 운영에서 로그에 잡히지 않는 침묵 실패가 30% 수준으로 발생했고 대시보드와 비용 분리 설계의 한계가 $2400 비용 손실로 이어져 초기부터 관찰성과 비용 귀속을 설계하게 되었다.
spaCy en_core_web_md 파이프라인을 Rust로 재구현해 WebAssembly로 컴파일한 단일 HTML 데모를 통해 로컬 실행과 spaCy 원본과의 거의 완전한 출력 일치를 보고했다.
이미지 생성의 디퓨전 원리를 텍스트에 적용하여 노이즈로부터 문장을 복원해내는 새로운 언어 모델링 기법이다.
Claude Code의 환경 휘발성 문제를 해결하고 10개 부서 에이전트 조직을 통해 지속 가능한 협업 체계를 구축한 NaverMadCat 플랫폼의 설계 노하우를 공유한다.
Nvidia B200과 SambaNova SN40을 결합하여 기존 대비 2배 빠른 추론 속도를 구현한 하이브리드 아키텍처 데모이다.
작성자는 100GbE 환경에서 70B 이상 모델 학습 시 네트워크 대역폭으로 인해 GPU 유휴가 발생해 비용이 최대 40% 증가한다고 지적하며 이를 계산하는 무료 TCO 계산기를 공개했다.
Roboflow의 RF-DETR 모델과 Transmission Detection 데이터셋을 이용해 송전선의 이물질과 케이블 손상을 자동 탐지하고 PASS/FAIL 판정과 JSON 리포트를 생성하는 검사 파이프라인을 구축한다.
Memora는 저장 내용과 검색 방식을 분리해 LoCoMo와 LongMemEval에서 SOTA를 달성하면서 최대 98%의 컨텍스트 토큰 절감을 기록했다.
Matt Shumer가 모델이 스스로 오류를 감지하고 수정하는 Reflection Tuning 기법과 이를 적용한 Reflection 70B 모델의 개발 과정을 공유한다.
여러 LLM을 결합하여 성능을 극대화하는 Mixture of Agents 아키텍처의 원리와 Hermes Agent를 활용한 실전 구축 및 배포 과정을 상세히 안내합니다.
CC News를 Parquet으로 변환한 뒤 로컬에서 임베딩을 생성하고 Pinecone로 일괄 업로드하는 재현 가능한 벡터 테스트셋 구축 워크플로이다.
PAR는 AWS SigV4 서명, Amazon Bedrock 기반 의미 검증, Split-Plane SQL을 결합해 테넌트별 행 수준 접근을 일관되게 보장하는 텍스트→SQL 셀프서비스 분석 에이전트를 운영했다.
두 단계 모델을 결합해 스캔 연감의 사진 경계와 이름 위치를 추출한 뒤 공간 추론으로 3,122개의 이름-얼굴 매칭을 생성하여 93%가 0.95 이상의 신뢰도를 기록했다.
이미지에 담긴 튜토리얼은 잔차 제곱합(SSR)을 계산하고 경사 하강법으로 기울기와 절편을 반복적으로 갱신하여 최적값을 찾는 단계적 절차를 포함한다.
Alane Suhr 교수가 LLM의 확률적 본질과 Instruction Tuning 과정을 통해 AI의 주체성이 기계가 아닌 인간에게 있음을 논증한다.
표기법이 인간의 사고 방식에 미치는 영향을 분석하고, 딥러닝을 활용해 논리적 불변성을 유지하는 새로운 시각적 표기 체계를 스스로 학습시키는 실험적 연구를 소개한다.
deeperseeker는 Deepseek를 파싱해 Anthropic과 OpenAI 호환 API 엔드포인트를 제공하며 멀티계정 풀링과 스트리밍/비스트리밍 지원을 포함한다
트럼프 대통령이 2028년까지 결함 허용 양자 컴퓨터 구축을 목표로 하는 행정 명령에 서명하며 중국과의 기술 경쟁 및 보안 위협 대응에 나섰다.
LLM 추론의 병목인 메모리 관리를 해결하기 위한 KV 캐시의 원리와 Paged Attention을 통한 GPU 효율화 방법을 다룹니다.
학습 로그와 시스템 통계가 담긴 노트북 스크린샷으로 CPU가 포화 상태이고 GPU 사용률이 낮아 병목 가능성이 보인다.
CV 인턴십 준비를 위한 단계별 학습 체크리스트에 Segmentation·OCR·VLMs 등 3개 전문 트랙을 추가한 GitHub 리포지토리 공유이다.
EACL 2027 CFP가 ARR 절차를 저자응답(9월14–19일)과 심사자 참여(9월20–24일)로 분리하여 논의 기간을 기존 5일에서 늘렸다.
Yobi는 Transformer와 Graph Neural Network를 결합한 'foundation model of behavior'로 인간 행동을 예측하며 초당 수백만 건의 개인화 결정을 프라이버시를 유지한 채 처리한다고 밝혔다.
Terminal Pilot은 OpenRouter의 무료 모델을 터미널에서 직접 호출하는 약 300줄 분량의 경량 Python CLI로, 파일 로드·stdin 파이프·시스템 프롬프트 교체를 지원한다.
LM Studio를 활용해 Ornith 9B 모델을 로컬에 설치하고 실전 코딩 및 앱 제작에 활용하는 방법을 단계별로 안내한다.
Merpay는 GCE의 Docker 컨테이너와 copy-on-write 세션, auth-proxy 기반 다층 방어로 결제 도메인용 자율 에이전트 pcp-agent를 운영하고 있다.
메르카리 NFT 팀은 하네스 구성요소는 플랫폼에서 확보하고 각종 판단기준은 팀이 직접 수집·정의하는 전략으로 AI-Native 개발을 진행했다.
Arena AI가 8개월 만에 매출 1억 달러를 달성하며 산업용 AI 시장의 폭발적인 수요와 기업 도입 가속화를 증명했다.
텍스트 프롬프트로 SAM 3을 사용해 즉시 객체의 바운딩 박스와 마스크를 얻고 자동 라벨링 후 RF-DETR로 전환해 프로덕션형 모델을 준비한다.
Roboflow와 RF-DETR로 활주로 이물질을 감지하고 Gemini 2.5 Pro로 분류·검사 요약을 생성하는 자동화 튜토리얼이다.
710개의 레이저 스캔 실내 장면과 14,800개 이상의 기능 요소에 대해 3D 어포던스, 동작 축·유형 및 자연어 작업 설명을 포함한 SceneFun3D 데이터셋이 Hugging Face에 공개되어 FiftyOne으로 비디오와 포인트클라우드를 함께 검토할 수 있다.
AI 코딩 에이전트가 만든 기술부채와 허위 완료 보고를 억제하기 위한 규칙 집합인 Universal Agent OS가 VS Code 확장과 GitHub 저장소로 공개되었다.
Unified Planner는 음성·채팅·텍스트 등 모든 Agentforce 상호작용을 단일 런타임으로 통합하여 일부 사례에서 응답 지연을 약 20초에서 2.3초로 줄인 AI 실행·추론 엔진이다.
Roboflow RF-DETR을 학습해 사출 성형 부품의 균열·파손·오염을 이미지로 자동 검출하고 Gemini 2.5 Pro로 검사 소견을 생성한다.
RF-DETR로 정제를 검출하고 VLM으로 결함 유형을 분류해 단일 이미지에서 각 정제의 검사 결과를 반환한다.
AgroVision은 NASA 기후 데이터와 머신러닝 예측을 활용해 니카라과 농지별 작황·손실·수익을 시뮬레이션하는 무료 데모이다.
Bedrock AgentCore의 CloudWatch 기반 관측 스택이 지표·트레이스·구조화된 로그를 결합해 에이전트의 추론 흐름과 툴 호출 오류를 원인 수준에서 규명하게 한다.
Amazon Bedrock Data Automation과 AgentCore를 결합해 CMS-1500 PDF에서 구조화된 JSON을 추출하고 검증을 거쳐 FHIR 청구 리소스를 생성하는 자동화 파이프라인을 구현했다.
Context Warp Drive는 요약 모델 없이 결정적 폴딩과 재생성 시드로 LLM 에이전트의 긴 컨텍스트를 저비용으로 유지하는 오픈소스 엔진이다.
Deep Agents를 통해 코드로 서브에이전트를 동적으로 생성하고 제어하여 복잡한 작업을 안정적으로 수행하는 6가지 핵심 패턴을 다룹니다.
Ornith-1.0은 DeepReinforce가 공개한 MIT 라이선스 기반의 코딩 특화 LLM으로 Gemma 4와 Qwen 3.5를 기반으로 9B·31B·35B MoE·397B MoE 변형을 제공하며 GGUF 20GB 파일로 로컬 실행이 가능하다.
사전 학습된 Qwen3.6-35B 고정-k MoE 모델에 런타임 임계값 기반의 제로-게이팅을 적용한 결과 전문가 수 변동은 가능하지만 대다수 설정에서 PPL 열화가 발생했고 라우터 미세조정이 필요함이 실험적으로 확인되었다.
스트리밍 스트라이프 병합으로 81,920×81,920 이미지에서 2,027만 개 폴리곤을 추출하고 피크 메모리 4.3GB를 기록했다.
Salesforce는 4.3백만 문의 데이터를 바탕으로 '해결' 기준을 정해 에이전트 건당 2달러의 결과 기반 과금을 제안했다.