2026년 3월 11일 AI 뉴스 아카이브

Hacker News - LLM Agents

MCP 도구 관리의 끝판왕, 토큰 61% 절감하는 MCP Spine 공개

MCP Spine은 LLM과 MCP 서버 사이에서 보안, 시맨틱 라우팅, 토큰 예산 관리 및 스키마 축소를 수행하는 로컬 우선 프록시 레이어이다.

MCP

TechCrunch AI Companies

AI 에이전트끼리 흥정하고 실제 돈으로 거래한다? Anthropic의 실험 결과

Anthropic이 AI 에이전트들이 구매자와 판매자가 되어 실제 돈과 물건을 거래하는 'Project Deal' 실험을 통해 에이전트 경제의 가능성을 확인했다.

Anthropic

r/LangChain Libraries Inference

Selenium 대신 선택한 50ms 응답 속도의 AI 에이전트 데이터 파이프라인

정부 사이트의 복잡한 레이아웃과 캡차 문제를 해결하기 위해 Google Dorks, Groq, MCP를 결합한 비동기 캐싱 아키텍처를 제안했다.

CrewAIGroqLlama-3

r/vibecoding

AI의 환각을 물리적으로 차단하는 Dot의 이중 메모리 검증 시스템

AI 에이전트 Dot은 글리프 주석자와 제작 탐지기를 활용한 이중 검증 시스템을 통해 허위 기억 저장과 환각 현상을 방지한다.

r/ClaudeCode Coding Agents

Claude Code의 건망증 해결! 프로젝트 맥락을 기억하는 Storybloq

Claude Code 세션 간의 맥락 단절을 해결하기 위해 로컬 레포지토리에 프로젝트 상태와 세션 인계 사항을 저장하고 관리하는 오픈소스 도구 Storybloq가 출시됐다.

Claude Code

r/ClaudeCode

Claude Code가 찾아낸 영상 번짐의 진범, AI로 해결한 인코딩 최적화

사용자가 해결하지 못한 영상의 색 번짐 현상을 Claude Code가 19분간의 분석 끝에 크로마 서브샘플링 문제로 진단하고 최적의 인코딩 워크플로를 제시했다.

r/PromptEngineering Language Models Companies

프롬프트 가로채기로 토큰 87% 절감하는 pando-proxy 공개

Codex의 API 호출을 가로채 프롬프트를 실시간으로 재작성함으로써 SWE-bench 테스트에서 토큰 사용량을 평균 87% 절감했다.

CodexOpenAISWE-bench

r/PromptEngineering Prompting

프롬프트에 '심호흡'은 이제 그만, 2026년형 구조화 전략

단순 텍스트 지시 대신 태그와 예시를 활용한 구조화된 프롬프트 설계가 모델의 성능과 일관성을 극대화한다.

Few-Shot

r/vibecoding Best Practices

멀티 AI 에이전트 협업의 핵심, MCP_ID로 태스크 모호성 해결하기

LLM 에이전트가 복잡하고 장기적인 작업을 수행할 때 발생할 수 있는 모호성을 제거하기 위해 기계와 인간이 모두 읽을 수 있는 고유 식별자(MCP_ID) 체계를 제안한다.

MCP_ID

AI Engineer

230만 토큰 분량의 API를 MCP 서버로? Cloudflare의 해결책

Cloudflare가 230만 토큰 규모의 방대한 REST API를 MCP 서버로 효율적으로 변환하기 위해 탐색한 코드 생성 및 도구 검색 기술을 다룹니다.

Two Minute Papers

NVIDIA가 공개한 4,200만 파라미터의 기적, 로봇을 춤추게 하는 초경량 AI SONIC

NVIDIA 연구진이 개발한 SONIC은 4,200만 개의 파라미터만으로 멀티모달 입력을 처리하여 인간의 복잡한 움직임을 실시간으로 구현하는 초경량 로봇 제어 모델이다.

Hacker News - LLM Libraries

LLM을 앱이 아닌 유닉스 명령어처럼 사용하기: Chatnik 가이드

Raku 기반의 Chatnik 패키지는 LLM을 독립된 앱이 아닌 유닉스 셸의 기본 명령어로 통합하여 파이프라인 구성과 영구적인 대화 관리를 지원한다.

Raku

TechCrunch AI

OpenAI 샘 알트만, 총기 난사 용의자 계정 차단하고도 신고 안 한 점 공식 사과

OpenAI CEO 샘 알트만이 캐나다 텀블러 리지 총기 난사 사건 용의자의 위험 활동을 감지하고도 수사 기관에 알리지 않은 것에 대해 공식 사과문을 발표했다.

Simon Willison

자전거 타는 펠리컨 위에 우주인과 말까지? AI 이미지 생성의 한계 도전

ChatGPT Images 2.0 모델을 사용하여 다층적인 객체 결합과 혼돈스러운 상황을 묘사하는 고난도 이미지 생성 벤치마크를 수행했다.

r/MachineLearning Domain AI

OpenVLA부터 π0까지, 로봇 AI가 행동을 결정하는 3가지 핵심 방식

OpenVLA, RT-2 등 현대적 VLA 모델이 시각·언어 입력을 로봇의 물리적 행동으로 변환하는 기술적 메커니즘과 주요 디코딩 전략을 분석했다.

OpenVLAπ0RT-2

HF Community Blogs

AI 모델 가중치에 숨겨진 기하학적 구조, 사영 코드북의 발견

훈련된 구체 솔버 모델의 M 텐서가 ℝP^(D-1) 공간상의 사영 코드북 구조를 형성함을 입증하고 이를 추출하는 API를 공개함

r/deeplearning Training Libraries

Gemma 4 모델 파인튜닝으로 배운 3가지 핵심 교훈과 데이터 오염의 위험성

Gemma 4 E2B 모델을 LoRA로 파인튜닝하여 Python 코드 생성 성능을 개선하고, 데이터 오염 및 지시사항 준수 특성에 대한 분석 결과를 공유했다.

LoRAPEFTTransformers

r/LLMDevs Agents

고정된 에이전트는 끝났다? 문제에 맞춰 스스로 진화하는 동적 에이전트 시스템

작업의 성격에 따라 런타임에 에이전트를 동적으로 생성하고 제거하며 마이크로서비스의 장애 원인을 분석하는 새로운 멀티 에이전트 프레임워크이다.

Multi-Agent

r/neuralnetworks Architecture

복잡한 Attention 구조를 한눈에 파악하는 시각화 다이어그램

입력 임베딩부터 Q, K, V 투영 및 최종 출력까지의 어텐션 메커니즘 전 과정을 텐서 차원과 함께 시각화한 자료이다.

Attention Mechanism

John Kim Coding Agents Language Models

Claude Code와 Pencil로 1시간 만에 앱 디자인 완성하는 실전 워크플로

Pencil, Claude Code, Gemini 등 다양한 AI 에이전트를 병렬로 활용하여 1시간 내에 아이디어 구상부터 고도화된 앱 디자인 및 마케팅 페이지까지 구축하는 실무 프로세스를 보여줍니다.

Claude CodeGemini

r/LLMDevs Language Models

화려한 추론보다 정확한 실행이 중요하다, Ling-2.6-1T가 주목받는 이유

실무 환경에서는 모델의 화려한 추론 능력보다 토큰당 작업 완료율과 도구 사용의 정확성 같은 실행 중심의 효율성이 더 중요하다는 논의이다.

Ling-2.6-1T

Nicolai Nielsen Products

단 15초 녹화로 완성하는 완벽한 AI 아바타 제작법

HeyGen의 Avatar V 기술을 사용하여 사용자의 외형과 목소리를 복제한 고품질 AI 아바타를 생성하고 다국어 비디오로 확장하는 방법을 다룹니다.

HeyGen

r/deeplearning Hardware Inference

H100에서 vLLM 벤치마크 결과 공개: MoE 모델이 Dense보다 14배 빠르다?

H100 80GB 환경에서 vLLM을 이용해 8개 모델을 벤치마킹한 결과, MoE 아키텍처와 FP8 양자화가 추론 처리량 향상에 결정적인 역할을 함이 확인됐다.

H100vLLM

r/MachineLearning Hardware Language Models

2.7GB Torch는 이제 그만, 3300줄의 C코드로 LLM 학습하기

PyTorch 없이 순수 C언어로 구현된 경량 딥러닝 라이브러리 NOTORCH가 공개되어 저사양 CPU 환경에서도 LLM 학습과 추론이 가능함을 입증했다.

CUDAnanoGPTNOTORCH

IBM Technology Companies Products

AI 에이전트 시스템 구축의 핵심, 오케스트레이션 전략 가이드

AI 에이전트 시스템 구축 시 직접 개발과 재사용 사이의 선택 기준과 이를 통합하는 오케스트레이션 계층의 중요성을 다룹니다.

IBMwatsonx

JeredBlu

OpenAI가 조용히 공개한 역대급 오픈 웨이트 PII 마스킹 모델

OpenAI가 공개한 오픈 웨이트 기반의 Privacy Filter 모델을 활용하여 문서 내 개인식별정보(PII)를 로컬 환경에서 안전하고 정확하게 제거하는 방법과 성능을 시연한다.

AICodeKing

Cursor가 SpaceX에 인수된다면? AI 코딩 도구 시장의 지각변동과 Kilo의 전략

Roo Code의 서비스 종료와 Cursor의 SpaceX 인수 가능성 속에서 Kilo가 모델 독립적인 VS Code 에이전트로서의 입지를 강화하고 있다

Vizuara

수식 없이 이해하는 Diffusion 모델의 작동 원리

DDPM은 이미지를 생성하는 것이 아니라 노이즈를 제거하는 법을 학습함으로써 데이터 분포를 파악하고 고품질 이미지를 복원하는 생성 모델이다.

Databricks Blog

미 금융당국의 새로운 AI 규제 지침, 데이터브릭스로 자동화된 거버넌스 구축하기

2026년 4월 개정된 미 금융당국의 모델 리스크 관리(MRM) 지침에 대응하여, 고전적 ML과 GenAI를 단일 플랫폼에서 통합 관리하는 Databricks 참조 아키텍처를 제시한다.

Simon Willison

Simon Willison의 LLM 도구 업데이트, GPT-5.5와 이미지 상세 설정 지원

CLI 도구인 llm 0.31 버전이 출시되어 GPT-5.5 모델 지원과 텍스트 장황도 및 이미지 상세도 설정 옵션이 추가됐다.

2026년 3월 11일 AI 뉴스

MCP 도구 관리의 끝판왕, 토큰 61% 절감하는 MCP Spine 공개

AI 에이전트끼리 흥정하고 실제 돈으로 거래한다? Anthropic의 실험 결과

Selenium 대신 선택한 50ms 응답 속도의 AI 에이전트 데이터 파이프라인

AI의 환각을 물리적으로 차단하는 Dot의 이중 메모리 검증 시스템

Claude Code의 건망증 해결! 프로젝트 맥락을 기억하는 Storybloq

Claude Code가 찾아낸 영상 번짐의 진범, AI로 해결한 인코딩 최적화

프롬프트 가로채기로 토큰 87% 절감하는 pando-proxy 공개

프롬프트에 '심호흡'은 이제 그만, 2026년형 구조화 전략

멀티 AI 에이전트 협업의 핵심, MCP_ID로 태스크 모호성 해결하기

230만 토큰 분량의 API를 MCP 서버로? Cloudflare의 해결책

NVIDIA가 공개한 4,200만 파라미터의 기적, 로봇을 춤추게 하는 초경량 AI SONIC

LLM을 앱이 아닌 유닉스 명령어처럼 사용하기: Chatnik 가이드

OpenAI 샘 알트만, 총기 난사 용의자 계정 차단하고도 신고 안 한 점 공식 사과

자전거 타는 펠리컨 위에 우주인과 말까지? AI 이미지 생성의 한계 도전

OpenVLA부터 π0까지, 로봇 AI가 행동을 결정하는 3가지 핵심 방식

AI 모델 가중치에 숨겨진 기하학적 구조, 사영 코드북의 발견

Gemma 4 모델 파인튜닝으로 배운 3가지 핵심 교훈과 데이터 오염의 위험성

고정된 에이전트는 끝났다? 문제에 맞춰 스스로 진화하는 동적 에이전트 시스템

복잡한 Attention 구조를 한눈에 파악하는 시각화 다이어그램

Claude Code와 Pencil로 1시간 만에 앱 디자인 완성하는 실전 워크플로

화려한 추론보다 정확한 실행이 중요하다, Ling-2.6-1T가 주목받는 이유

단 15초 녹화로 완성하는 완벽한 AI 아바타 제작법

H100에서 vLLM 벤치마크 결과 공개: MoE 모델이 Dense보다 14배 빠르다?

2.7GB Torch는 이제 그만, 3300줄의 C코드로 LLM 학습하기

AI 에이전트 시스템 구축의 핵심, 오케스트레이션 전략 가이드

OpenAI가 조용히 공개한 역대급 오픈 웨이트 PII 마스킹 모델

Cursor가 SpaceX에 인수된다면? AI 코딩 도구 시장의 지각변동과 Kilo의 전략

수식 없이 이해하는 Diffusion 모델의 작동 원리

미 금융당국의 새로운 AI 규제 지침, 데이터브릭스로 자동화된 거버넌스 구축하기

Simon Willison의 LLM 도구 업데이트, GPT-5.5와 이미지 상세 설정 지원

3D 에이전트의 환각 문제, 추가 학습 없이 정확도 최대 35.8% 향상

지식 그래프 기반 외부 메모리로 LLM의 장기 기억과 추론 능력 대폭 강화

Claude Code에서 GPT와 Gemini를 동시에? MCP 기반 Proxima 공개

사용하면서 코드가 바뀌는 앱? Claude Code 기반 실시간 개발 도구

Claude Code의 토큰 낭비 해결, 96% 절감하는 로컬 지식 그래프 도구

Cohere와 Aleph Alpha의 결합, 미국 주도 AI 시장에 도전장

AI가 만든 앱 89%가 보안 헤더 누락? 312개 사이트 전수 조사 결과

코딩 몰라도 Kaggle 중위권? AI를 '조종'하여 구축한 자동화 루프

에이전트가 늘어날수록 인간이 병목? 게임에서 찾은 협업의 해답

Claude Code에 Obsidian을 연결해 영구 지능형 메모리 구축하기

프롬프트만으로는 부족하다? 에이전트의 일탈을 막는 실시간 가드레일 솔루션

90억 달러 가치의 Replit이 정의하는 AI 시대의 새로운 코딩 방식

Claude Code 사용 시 긴 메시지 작성이 불편했다면? NTerminal 출시

Claude Code와 채팅을 하나로 묶는 로컬 SQLite 기반 지식 저장소

번거로운 개발 환경 설정, Claude Code로 자동화한 후기

데이터가 부족한 희소 행렬, '주제적 활성화'로 정보 검색 효율 극대화하기

단순 승인은 HITL이 아니다? 실무 에이전트 아키텍처의 3가지 핵심 패턴

Claude Code 품질 저하 해결책? GPT-5.5 탑재 Codex CLI 핵심 기능 23가지

Claude Code로 버그 없이 코딩하는 실전 워크플로와 문서화 전략

Claude Code Windows 검색 오류 해결 패치 공개

LLM으로 버그를 잡는다? OSS-Fuzz보다 1.6배 강력한 PromptFuzz 공개

월 200달러 LLM 비용을 25달러로? 실전 토큰 절감 가이드

포르투갈의 AI 주권 선언: 국가 주도 LLM 'AMÁLIA' 550만 유로 투입 개발

GPU 없이 LLM 실행? 하드웨어와 소프트웨어의 경계를 허무는 FPGA 실험

Claude Code 개발자가 직접 알려주는 30분 활용 꿀팁 워크숍

내 컴퓨터에서 직접 돌아가는 AI OS, Patchwork OS 공개

Claude Code 사용자 주의! AI 도구를 타고 번지는 자가 증식 웜 발견

LLM 비용과 라우팅을 한눈에, Plano 0.4.22 TUI 업데이트

소형 모델도 GRPO를 만나면 64토큰 초압축 요약이 가능할까?

Claude Code와 에이전트들이 함께 일하는 AI 전용 가상 오피스, WUPHF

LLM의 고질적인 환각 문제, 대조 샘플링으로 해결한다

복잡한 MCP 서버 관리 해결사, 통합 엔드포인트 아키텍처 공개

2026년 충격 보고서: AI가 동료를 살리려 인간을 속이기 시작했다

GPT-5.5 에이전트 코딩 성능, 독립 벤치마크서 전작보다 하락?

Claude Code 실무자를 위한 핵심 구조와 설정 팁 총정리

내 직업은 안전할까? Anthropic이 분석한 AI 도입을 가로막는 5가지 장벽

GPT Image 2 결과가 랜덤인가요? 성공률 높이는 5단계 프롬프트 공식

15개 프로젝트를 동시에? AI 코딩 에이전트 관리를 위한 Measure 프레임워크

AI가 코드를 자꾸 잊어버린다면? 95% 정확도의 메모리 API 활용법

GCC 컴파일러 개발에 AI 도입될까? 전담 워킹 그룹 공식 출범

채팅 로그는 정답이 아니다? 개인용 AI 에이전트 성능을 높이는 데이터 소스 팁

GPT-5.5 출시와 에너지 70% 절감 칩 등장, AI가 현실 세계로 도약했다

동일한 Gemini 모델도 프롬프트에 따라 투자 성향이 완전히 달라진다

Claude Code의 생산성을 극대화하는 8가지 필수 플러그인 가이드

Claude 프로젝트 파일은 전부 로드될까? 토큰 절약을 위한 로딩 구조 분석

Claude가 내 은행 업무를? MCP로 구현한 에이전트 뱅킹 실전기

ChatGPT 사용량은 폭증하는데 왜 사람들은 AI를 싫어할까?

EEG AI 모델의 임상 배포 장벽, 최적화 없는 TTA 기법으로 극복 가능성 확인

MoE 모델의 전문가 교체율을 50%에서 5%로 낮춰 추론 효율 극대화