2026년 3월 14일 AI 뉴스 아카이브

Mobileye

Mobileye SuperVision: 뮌헨 도심을 누비는 눈을 떼지 않는 자율 주행

Mobileye SuperVision 시스템이 양산형 ECU 하드웨어를 탑재한 차량으로 독일 뮌헨의 복잡한 도심 환경에서 자율 주행하는 과정을 시연한다.

r/LLMDevs Libraries

시스템 프롬프트의 한계 극복, 프록시로 에이전트 이탈 막는다

시스템 프롬프트 대신 프록시 계층에서 마크다운 기반 규칙을 강제하여 LLM 에이전트의 규칙 이탈을 방지하는 오픈소스 프로젝트 Caliber가 공개됐다.

AutoGenCrewAILangGraph

HF Community Blogs

엣지 기기용 AI 에이전트의 추론과 웹 검색 능력을 높일 260K 데이터셋

엣지 에이전트의 추론 및 웹 검색 능력 향상을 위한 26만 건 규모의 전문 데이터셋이 Hugging Face 커뮤니티를 통해 공개되었습니다.

r/LangChain Libraries

에이전트가 스스로를 최적화한다? Autoharness로 성능 40% 끌어올리기

에이전트의 실행 환경(Harness)을 자율적으로 최적화하는 Autoharness를 통해 tau2 벤치마크 기준 성능을 40% 향상시킨 사례와 오픈소스가 공개됐다.

Agentic Context Engine

r/vibecoding Coding Agents Language Models

Claude와 Gemini가 동시에 코딩한다? 에이전트 군단을 지휘하는 AGTX

Claude Code, Gemini 등 다양한 코딩 에이전트를 병렬로 실행하고 MCP 기반 관리자가 작업을 자동 배분하는 TUI 도구이다.

Claude CodeGeminiMCP

AICodeKing Language Models Companies

DeepSeek V4 Pro를 무료로? NVIDIA NIM으로 코딩 에이전트 구축하기

NVIDIA NIM API 카탈로그를 통해 DeepSeek V4 Pro 및 Flash 모델을 무료로 테스트하고 기존 OpenAI 호환 도구에 통합하는 실전 가이드를 제공한다.

DeepSeek V4 FlashDeepSeek V4 ProNVIDIA

r/vibecoding Products

NotebookLM이 10년치 강의 데이터를 분석해 찾아낸 '학생들이 진짜 모르는 것'

한 교수가 NotebookLM을 활용해 10년치 강의 데이터를 분석한 결과, 학생들이 공통적으로 겪는 학습 결손의 근본 원인이 학기 초반의 기초 개념 부족이었음을 발견했다.

NotebookLM

r/LLMDevs Agents

AI 에이전트를 위한 고성능 다국어 웹 크롤링 엔진 kreuzcrawl

다국어 환경을 지원하고 MCP 서버가 통합된 고성능 웹 크롤링 엔진 kreuzcrawl이 공개됐다.

MCP

HF Community Blogs

AI 에이전트의 한계 돌파: 파편화된 데이터를 '살아있는 지식'으로 바꾸는 AKMM 방법론

AI 에이전트가 비즈니스 케이스를 파편화된 데이터가 아닌 상태와 생애주기를 가진 '능동적 실체'로 인식하게 만드는 새로운 지식 모델링 표준인 AKMM을 제안합니다.

r/ClaudeCode Coding Agents

Opus 4.7로 바꿨더니 비용 폭탄? Claude Code의 비효율적 도구 호출 문제

Claude Code에서 Opus 4.7 사용 시 도구 호출을 병렬화하지 않고 직렬로 처리하여 캐시 읽기 토큰이 급증하는 최적화 문제가 보고됐다.

Claude Code

r/MachineLearning Optimization Libraries

Muon 최적화 도구를 AdamW처럼 쉽게? AutoMuon 오픈소스 공개

PyTorch 모델의 파라미터를 자동 분석하여 Muon과 AdamW를 적재적소에 배치해주는 AutoMuon 패키지가 공개됐다.

AdamWPyTorch

r/ClaudeCode Companies Coding Agents

Claude Code 사용량 확인이 번거롭다면? ESP32 기반 전용 모니터링 기기 등장

Claude Code 사용자가 Anthropic API의 5시간 및 7일 단위 사용량 제한을 실시간으로 확인할 수 있는 ESP32 기반 오픈소스 하드웨어 장치를 개발했다.

AnthropicClaude Code

r/PromptEngineering Language Models Companies

OpenAI 실시간 API는 다르다? 10분 대화도 끄떡없는 프롬프트 팁

OpenAI Realtime API를 활용한 실시간 음성 튜터 개발 과정에서 발견한 기존 Chat API와의 프롬프트 엔지니어링 차이점과 최적화 전략을 공유한다.

GPTOpenAI

Hacker News - LLM

Claude Code와 Codex에서 스스로 관리되는 프로젝트 위키를 구축하는 법

LLM 에이전트가 프로젝트의 소스 코드를 분석하여 위키를 자동 생성하고, 구현 계획 수립 전 과거 지식을 검색하도록 돕는 에이전트 스킬 패키지입니다.

Hacker News - LLM Agents

MCP 도구 관리의 끝판왕, 토큰 61% 절감하는 MCP Spine 공개

MCP Spine은 LLM과 MCP 서버 사이에서 보안, 시맨틱 라우팅, 토큰 예산 관리 및 스키마 축소를 수행하는 로컬 우선 프록시 레이어이다.

MCP

TechCrunch AI Companies

AI 에이전트끼리 흥정하고 실제 돈으로 거래한다? Anthropic의 실험 결과

Anthropic이 AI 에이전트들이 구매자와 판매자가 되어 실제 돈과 물건을 거래하는 'Project Deal' 실험을 통해 에이전트 경제의 가능성을 확인했다.

Anthropic

r/PromptEngineering Prompting

프롬프트에 '심호흡'은 이제 그만, 2026년형 구조화 전략

단순 텍스트 지시 대신 태그와 예시를 활용한 구조화된 프롬프트 설계가 모델의 성능과 일관성을 극대화한다.

Few-Shot

AI Engineer

230만 토큰 분량의 API를 MCP 서버로? Cloudflare의 해결책

Cloudflare가 230만 토큰 규모의 방대한 REST API를 MCP 서버로 효율적으로 변환하기 위해 탐색한 코드 생성 및 도구 검색 기술을 다룹니다.

Two Minute Papers

NVIDIA가 공개한 4,200만 파라미터의 기적, 로봇을 춤추게 하는 초경량 AI SONIC

NVIDIA 연구진이 개발한 SONIC은 4,200만 개의 파라미터만으로 멀티모달 입력을 처리하여 인간의 복잡한 움직임을 실시간으로 구현하는 초경량 로봇 제어 모델이다.

TechCrunch AI

OpenAI 샘 알트만, 총기 난사 용의자 계정 차단하고도 신고 안 한 점 공식 사과

OpenAI CEO 샘 알트만이 캐나다 텀블러 리지 총기 난사 사건 용의자의 위험 활동을 감지하고도 수사 기관에 알리지 않은 것에 대해 공식 사과문을 발표했다.

Simon Willison

자전거 타는 펠리컨 위에 우주인과 말까지? AI 이미지 생성의 한계 도전

ChatGPT Images 2.0 모델을 사용하여 다층적인 객체 결합과 혼돈스러운 상황을 묘사하는 고난도 이미지 생성 벤치마크를 수행했다.

r/MachineLearning Domain AI

OpenVLA부터 π0까지, 로봇 AI가 행동을 결정하는 3가지 핵심 방식

OpenVLA, RT-2 등 현대적 VLA 모델이 시각·언어 입력을 로봇의 물리적 행동으로 변환하는 기술적 메커니즘과 주요 디코딩 전략을 분석했다.

OpenVLAπ0RT-2

r/deeplearning Training Libraries

Gemma 4 모델 파인튜닝으로 배운 3가지 핵심 교훈과 데이터 오염의 위험성

Gemma 4 E2B 모델을 LoRA로 파인튜닝하여 Python 코드 생성 성능을 개선하고, 데이터 오염 및 지시사항 준수 특성에 대한 분석 결과를 공유했다.

LoRAPEFTTransformers

r/neuralnetworks Architecture

복잡한 Attention 구조를 한눈에 파악하는 시각화 다이어그램

입력 임베딩부터 Q, K, V 투영 및 최종 출력까지의 어텐션 메커니즘 전 과정을 텐서 차원과 함께 시각화한 자료이다.

Attention Mechanism

Nicolai Nielsen Products

단 15초 녹화로 완성하는 완벽한 AI 아바타 제작법

HeyGen의 Avatar V 기술을 사용하여 사용자의 외형과 목소리를 복제한 고품질 AI 아바타를 생성하고 다국어 비디오로 확장하는 방법을 다룹니다.

HeyGen

r/deeplearning Hardware Inference

H100에서 vLLM 벤치마크 결과 공개: MoE 모델이 Dense보다 14배 빠르다?

H100 80GB 환경에서 vLLM을 이용해 8개 모델을 벤치마킹한 결과, MoE 아키텍처와 FP8 양자화가 추론 처리량 향상에 결정적인 역할을 함이 확인됐다.

H100vLLM

JeredBlu

OpenAI가 조용히 공개한 역대급 오픈 웨이트 PII 마스킹 모델

OpenAI가 공개한 오픈 웨이트 기반의 Privacy Filter 모델을 활용하여 문서 내 개인식별정보(PII)를 로컬 환경에서 안전하고 정확하게 제거하는 방법과 성능을 시연한다.

AICodeKing

Cursor가 SpaceX에 인수된다면? AI 코딩 도구 시장의 지각변동과 Kilo의 전략

Roo Code의 서비스 종료와 Cursor의 SpaceX 인수 가능성 속에서 Kilo가 모델 독립적인 VS Code 에이전트로서의 입지를 강화하고 있다

Vizuara

수식 없이 이해하는 Diffusion 모델의 작동 원리

DDPM은 이미지를 생성하는 것이 아니라 노이즈를 제거하는 법을 학습함으로써 데이터 분포를 파악하고 고품질 이미지를 복원하는 생성 모델이다.

Databricks Blog

미 금융당국의 새로운 AI 규제 지침, 데이터브릭스로 자동화된 거버넌스 구축하기

2026년 4월 개정된 미 금융당국의 모델 리스크 관리(MRM) 지침에 대응하여, 고전적 ML과 GenAI를 단일 플랫폼에서 통합 관리하는 Databricks 참조 아키텍처를 제시한다.

Simon Willison

Simon Willison의 LLM 도구 업데이트, GPT-5.5와 이미지 상세 설정 지원

CLI 도구인 llm 0.31 버전이 출시되어 GPT-5.5 모델 지원과 텍스트 장황도 및 이미지 상세도 설정 옵션이 추가됐다.

r/vibecoding Coding Agents Agents

내 컴퓨터에서 돌아가는 자율 코딩 에이전트 Gitoma 공개

로컬 LLM을 활용해 GitHub 저장소를 분석하고 스스로 PR까지 작성하는 자율 에이전트 Gitoma와 텔레메트리 도구 Occam Observer가 공개됐다.

GitomaMCPOllama

r/vibecoding Language Models Companies

NVIDIA가 공개한 Ising, 양자 컴퓨터 오류 수정 속도 2.5배 향상

NVIDIA가 양자 컴퓨터의 자동 보정 및 오류 수정을 가속화하는 세계 최초의 오픈 소스 AI 모델 Ising을 출시했다.

IsingNVIDIA

r/LangChain Libraries Vector DB

RAG 성능 측정의 고통을 해결할 자동화 평가 도구 공개

LangGraph와 RAGAS를 결합하여 문서 기반 테스트 케이스 생성부터 성능 지표 분석까지 자동화하는 RAG 평가 도구가 공개됐다.

LangGraphQdrantRAGAS

r/vibecoding Language Models Products

Claude의 모호한 답변 해결법: 비즈니스 명저 14권을 실행 가능한 스킬로 구조화하기

Claude가 비즈니스 서적의 내용을 표면적으로만 이해하는 한계를 극복하기 위해 14권의 방법론을 의사결정 트리와 루브릭으로 구조화하여 성능을 개선한 사례이다.

ClaudeGitHub

r/ClaudeCode Coding Agents Libraries

Claude Code에서 DeepSeek와 Gemini를? 멀티 모델 연동 키트 등장

Claude Code의 에이전트 워크플로를 DeepSeek, OpenAI, Gemini 등 타사 LLM에서도 원활하게 실행할 수 있도록 돕는 설정 키트와 미들웨어가 공개됐다.

Claude CodeLiteLLMMCP

r/vibecoding Audio AI Inference

클라우드 없이 내 컴퓨터에서 PDF를 팟캐스트로 변환하기

llama.cpp와 LFM2.5 Audio를 활용하여 PDF 문서를 두 명의 진행자가 대화하는 팟캐스트 오디오로 변환하는 로컬 실행 도구가 공개됐다.

LFM2.5 Audiollama.cpp

r/ClaudeCode Companies

모델 바꿀 때마다 수만 토큰 낭비? HANDOFF.md로 해결하세요

Anthropic의 사용량 제한으로 모델을 자주 교체할 때 발생하는 문맥 파악용 토큰 낭비를 줄이기 위해 로컬 작업 상태를 문서화하는 CLI 도구가 공개됐다.

Anthropic

r/ClaudeCode Coding Agents Dev Tools

Claude Code에서 이미지 생성이 안 된다고? Codex 연동 플러그인 등장

Claude Code에 이미지 생성 기능이 없는 한계를 극복하기 위해 Codex CLI의 gpt-image-2를 연동하는 오픈소스 플러그인이 출시됐다.

Claude CodeCodex CLIgpt-image-2

r/LLMDevs Companies Architecture

KV-캐시 6배 압축해도 AI가 바보 되는 이유, '관리 계층'에 답이 있다

LLM의 메모리 압축 기술은 발전했으나, 정보 간 충돌 감지 및 최신성 유지와 같은 '관리(Manage)' 계층의 벤치마크 부재가 기업용 AI 실패의 핵심 원인으로 지목됐다.

Google ResearchKV-cache

r/ClaudeCode

모델 순위가 뒤바뀌는 마법, 하네스 설계가 AI 성능을 결정한다

가상 기업 데이터를 활용한 조직 기억 벤치마크 결과, 명시적 가이드라인(하네스)의 유무에 따라 모델 간 성능 순위가 역전됨이 확인됐다.

r/ClaudeCode Coding Agents Agents

Claude Code의 한계를 넘다: 병렬 서브에이전트로 구현한 고품질 연구 스킬

Claude Code에서 병렬 서브에이전트와 반대 관점 검증 기법을 활용해 고품질 연구 데이터를 자동 정리하는 오픈소스 스킬이 공개됐다.

Claude CodeSubagent

r/LLMDevs Language Models

오염된 데이터 속에서 '녹슨 바늘'을 찾는 LLM은 무엇일까?

노이즈가 섞인 1,000개의 레이블 중 손상된 타겟을 찾거나 정답이 없을 때 NULL을 반환하는 능력을 측정하는 새로운 벤치마크 결과가 공개됐다.

Doubao Seed 2.0 Lite

r/LangChain Libraries Inference

Selenium 대신 선택한 50ms 응답 속도의 AI 에이전트 데이터 파이프라인

정부 사이트의 복잡한 레이아웃과 캡차 문제를 해결하기 위해 Google Dorks, Groq, MCP를 결합한 비동기 캐싱 아키텍처를 제안했다.

CrewAIGroqLlama-3

r/vibecoding

AI의 환각을 물리적으로 차단하는 Dot의 이중 메모리 검증 시스템

AI 에이전트 Dot은 글리프 주석자와 제작 탐지기를 활용한 이중 검증 시스템을 통해 허위 기억 저장과 환각 현상을 방지한다.

r/ClaudeCode Coding Agents

Claude Code의 건망증 해결! 프로젝트 맥락을 기억하는 Storybloq

Claude Code 세션 간의 맥락 단절을 해결하기 위해 로컬 레포지토리에 프로젝트 상태와 세션 인계 사항을 저장하고 관리하는 오픈소스 도구 Storybloq가 출시됐다.

Claude Code

r/ClaudeCode

Claude Code가 찾아낸 영상 번짐의 진범, AI로 해결한 인코딩 최적화

사용자가 해결하지 못한 영상의 색 번짐 현상을 Claude Code가 19분간의 분석 끝에 크로마 서브샘플링 문제로 진단하고 최적의 인코딩 워크플로를 제시했다.

r/ClaudeCode Coding Agents Agents

Claude Code에서 GPT와 Gemini를 동시에? MCP 기반 Proxima 공개

Claude Code 환경에서 MCP를 통해 다양한 AI 모델을 연결하고 실시간 웹 검색 및 45개 이상의 커스텀 도구를 통합하는 오픈소스 프로젝트 Proxima가 공개됐다.

Claude CodeMCP

r/PromptEngineering Language Models Companies

프롬프트 가로채기로 토큰 87% 절감하는 pando-proxy 공개

Codex의 API 호출을 가로채 프롬프트를 실시간으로 재작성함으로써 SWE-bench 테스트에서 토큰 사용량을 평균 87% 절감했다.

CodexOpenAISWE-bench

r/vibecoding Best Practices

멀티 AI 에이전트 협업의 핵심, MCP_ID로 태스크 모호성 해결하기

LLM 에이전트가 복잡하고 장기적인 작업을 수행할 때 발생할 수 있는 모호성을 제거하기 위해 기계와 인간이 모두 읽을 수 있는 고유 식별자(MCP_ID) 체계를 제안한다.

MCP_ID

r/ClaudeCode Coding Agents

사용하면서 코드가 바뀌는 앱? Claude Code 기반 실시간 개발 도구

Claude Code를 Next.js 앱 내 iframe으로 통합하여 사용자가 앱을 조작하는 동시에 실시간으로 코드를 수정하고 반영하는 로컬 개발 환경 프로젝트이다.

Claude Code

r/ClaudeCode Coding Agents Agents

Claude Code의 토큰 낭비 해결, 96% 절감하는 로컬 지식 그래프 도구

코드베이스를 SQLite 지식 그래프로 변환하여 MCP를 통해 AI 에이전트에게 전달함으로써 토큰 사용량을 96.6% 절감하는 Fullerenes 프로젝트가 공개됐다.

Claude CodeMCP

Hacker News - LLM Libraries

LLM을 앱이 아닌 유닉스 명령어처럼 사용하기: Chatnik 가이드

Raku 기반의 Chatnik 패키지는 LLM을 독립된 앱이 아닌 유닉스 셸의 기본 명령어로 통합하여 파이프라인 구성과 영구적인 대화 관리를 지원한다.

Raku

HF Community Blogs

AI 모델 가중치에 숨겨진 기하학적 구조, 사영 코드북의 발견

훈련된 구체 솔버 모델의 M 텐서가 ℝP^(D-1) 공간상의 사영 코드북 구조를 형성함을 입증하고 이를 추출하는 API를 공개함

TechCrunch AI

Cohere와 Aleph Alpha의 결합, 미국 주도 AI 시장에 도전장

캐나다의 Cohere가 독일의 Aleph Alpha를 인수하며 유럽 시장을 겨냥한 주권적 AI 대안을 제시하고 200억 달러의 기업 가치를 인정받았습니다.

r/vibecoding Coding Agents

AI가 만든 앱 89%가 보안 헤더 누락? 312개 사이트 전수 조사 결과

AI 어시스턴트로 제작된 312개 웹사이트를 분석한 결과, 평균 보안 점수가 48점에 불과하며 대다수가 CSP 누락 및 취약한 쿠키 설정을 가진 것으로 나타났다.

Claude Code

r/vibecoding Benchmarks

코딩 몰라도 Kaggle 중위권? AI를 '조종'하여 구축한 자동화 루프

비개발자 사용자가 자연어 지시만으로 AI 시스템이 스스로 코드를 작성, 테스트, Kaggle 제출 및 피드백 반영까지 수행하는 반자율 워크플로를 구축했다.

Kaggle

r/LLMDevs Agents

고정된 에이전트는 끝났다? 문제에 맞춰 스스로 진화하는 동적 에이전트 시스템

작업의 성격에 따라 런타임에 에이전트를 동적으로 생성하고 제거하며 마이크로서비스의 장애 원인을 분석하는 새로운 멀티 에이전트 프레임워크이다.

Multi-Agent

AI Engineer Agents

에이전트가 늘어날수록 인간이 병목? 게임에서 찾은 협업의 해답

멀티 에이전트 시스템의 병목인 인간의 인지 부하 문제를 해결하기 위해 게임 메커니즘을 활용한 오케스트레이션 도구 AgentCraft를 제안한다.

AgentCraft

r/ClaudeCode Coding Agents Products

Claude Code에 Obsidian을 연결해 영구 지능형 메모리 구축하기

Claude Code의 세션 제한을 극복하기 위해 Obsidian 노트를 영구 메모리 층으로 활용하는 26개의 명령어와 자동화 에이전트 시스템이 공개됐다.

Claude CodeObsidian

r/PromptEngineering Libraries

프롬프트만으로는 부족하다? 에이전트의 일탈을 막는 실시간 가드레일 솔루션

시스템 프롬프트 기반의 제약 사항이 실무 환경에서 무시되는 문제를 해결하기 위해 마크다운 규칙을 런타임에 강제하는 프록시 시스템이 제안됐다.

CrewAIGuardrails AILangGraph

John Kim Coding Agents Language Models

Claude Code와 Pencil로 1시간 만에 앱 디자인 완성하는 실전 워크플로

Pencil, Claude Code, Gemini 등 다양한 AI 에이전트를 병렬로 활용하여 1시간 내에 아이디어 구상부터 고도화된 앱 디자인 및 마케팅 페이지까지 구축하는 실무 프로세스를 보여줍니다.

Claude CodeGemini

Y Combinator Coding Agents Dev Tools

90억 달러 가치의 Replit이 정의하는 AI 시대의 새로운 코딩 방식

Replit CEO 암자드 마사드가 AI 에이전트를 통해 비개발자도 자연어로 실제 소프트웨어를 구축하고 배포할 수 있는 '바이브 코딩'의 미래와 Agent 4의 혁신을 공유한다.

Agent 4Replit

r/ClaudeCode Coding Agents Dev Tools

Claude Code 사용 시 긴 메시지 작성이 불편했다면? NTerminal 출시

QTerminal 하단에 멀티라인 텍스트 편집창을 추가하여 Claude Code 등 CLI 기반 AI 에이전트와 더 효율적으로 상호작용할 수 있게 돕는 도구이다.

Claude CodeCodex CLIGemini CLI

r/ClaudeCode Coding Agents

Claude Code와 채팅을 하나로 묶는 로컬 SQLite 기반 지식 저장소

Claude의 여러 인터페이스 간 지식 공유 문제를 해결하기 위해 SQLite와 도구 호출을 활용한 로컬 텍스트 검색 저장소 Brainchair가 공개됐다.

Claude Code

r/ClaudeCode Coding Agents

번거로운 개발 환경 설정, Claude Code로 자동화한 후기

새 맥북 구매 후 Claude Code를 사용하여 개발 도구 설치 및 PATH 설정을 자동화한 실무 경험을 공유했다.

Claude Code

r/LLMDevs Language Models

화려한 추론보다 정확한 실행이 중요하다, Ling-2.6-1T가 주목받는 이유

실무 환경에서는 모델의 화려한 추론 능력보다 토큰당 작업 완료율과 도구 사용의 정확성 같은 실행 중심의 효율성이 더 중요하다는 논의이다.

Ling-2.6-1T

r/LLMDevs Libraries Language Models

데이터가 부족한 희소 행렬, '주제적 활성화'로 정보 검색 효율 극대화하기

희소 의미 행렬의 데이터 공백 문제를 해결하기 위해 시드 앵커, 브릿지 용어, 구조적 앵커 등 다양한 주제적 활성화 전략과 구체적인 구현 방법론을 제시한다.

JAXPyTorchQwen

r/LangChain Libraries

단순 승인은 HITL이 아니다? 실무 에이전트 아키텍처의 3가지 핵심 패턴

엔터프라이즈 에이전트 설계 시 단순 최종 승인이 아닌 실행 중간 개입과 상태 가시성을 확보하는 런타임 아키텍처 설계가 필수적이다.

CrewAILangGraph

개발동생 Coding Agents Dev Tools

Claude Code 품질 저하 해결책? GPT-5.5 탑재 Codex CLI 핵심 기능 23가지

OpenAI의 최신 모델 GPT-5.5를 탑재한 Codex CLI의 설치부터 권한 설정, 계획 모드, 자동 리뷰 등 개발 생산성을 극대화하는 23가지 핵심 기능을 상세히 다룬다.

Claude CodeCodex CLIOpenAI

r/vibecoding Coding Agents

Claude Code로 버그 없이 코딩하는 실전 워크플로와 문서화 전략

Claude Code 사용자가 수개월간의 시행착오 끝에 정립한 계획 수립, 단계별 구현, 문서화 기반의 지속적 학습 워크플로를 공유했다.

Claude Code

r/ClaudeCode Companies Coding Agents

Claude Code Windows 검색 오류 해결 패치 공개

Claude Code v2.1.113 업데이트 이후 Windows에서 발생하는 ripgrep(rg.exe) 누락 오류의 원인과 자동 패치 도구를 공유한다.

AnthropicClaude Code

Hacker News - LLM

LLM으로 버그를 잡는다? OSS-Fuzz보다 1.6배 강력한 PromptFuzz 공개

LLM 프롬프트 변이 루프를 활용해 라이브러리 코드 커버리지를 극대화하고 보안 취약점을 자동으로 탐지하는 퍼즈 드라이버 생성 도구입니다.

Hacker News - LLM

월 200달러 LLM 비용을 25달러로? 실전 토큰 절감 가이드

대규모 상품 분류 시스템에서 컨텍스트 압축, 계층적 분류, DB 기반 유사도 캐싱 및 배치를 통해 LLM 비용을 90% 이상 절감한 실전 사례를 소개합니다.

r/MachineLearning Hardware Language Models

2.7GB Torch는 이제 그만, 3300줄의 C코드로 LLM 학습하기

PyTorch 없이 순수 C언어로 구현된 경량 딥러닝 라이브러리 NOTORCH가 공개되어 저사양 CPU 환경에서도 LLM 학습과 추론이 가능함을 입증했다.

CUDAnanoGPTNOTORCH

Hacker News - LLM

포르투갈의 AI 주권 선언: 국가 주도 LLM 'AMÁLIA' 550만 유로 투입 개발

포르투갈 정부가 국가 데이터 주권 확보와 포르투갈어 보존을 위해 550만 유로를 투자하여 오픈 소스 기반의 국가 LLM인 AMÁLIA를 개발한다.

IBM Technology Companies Products

AI 에이전트 시스템 구축의 핵심, 오케스트레이션 전략 가이드

AI 에이전트 시스템 구축 시 직접 개발과 재사용 사이의 선택 기준과 이를 통합하는 오케스트레이션 계층의 중요성을 다룹니다.

IBMwatsonx

r/LLMDevs Libraries

GPU 없이 LLM 실행? 하드웨어와 소프트웨어의 경계를 허무는 FPGA 실험

LLM의 Transformer 연산을 하드웨어 회로로 직접 변환하여 FPGA에서 저전력으로 실행하려는 야심찬 오픈소스 프로젝트가 공개되었습니다.

BriefSystemVerilog

r/ClaudeCode Companies Coding Agents

Claude Code 개발자가 직접 알려주는 30분 활용 꿀팁 워크숍

Anthropic의 Claude Code 개발자가 직접 도구의 잠재력을 최대로 끌어올리는 올바른 사용법을 30분 분량의 워크숍 영상으로 공개했다.

AnthropicClaude Code

r/ClaudeCode Products

내 컴퓨터에서 직접 돌아가는 AI OS, Patchwork OS 공개

Patchwork OS는 로컬 환경에서 YAML 레시피를 통해 캘린더, 이메일, Git 등 다양한 도구를 자동화하는 오픈 소스 AI 에이전트 시스템이다.

Patchwork OS

r/ClaudeCode Companies Coding Agents

Claude Code 사용자 주의! AI 도구를 타고 번지는 자가 증식 웜 발견

AI 에이전트 도구 기업 Namastex Labs의 npm 패키지 16개에서 Anthropic API 키와 클라우드 자격 증명을 노리는 자가 증식 웜이 발견됐다.

AnthropicClaude CodeMCP

r/ClaudeCode Coding Agents

LLM 비용과 라우팅을 한눈에, Plano 0.4.22 TUI 업데이트

LLM 오케스트레이션 도구 Plano가 로컬 TUI를 통해 모델별 비용 모니터링과 정책 기반 동적 라우팅 기능을 새롭게 지원한다.

Claude Code

r/MachineLearning Training Libraries

소형 모델도 GRPO를 만나면 64토큰 초압축 요약이 가능할까?

GRPO 강화학습과 METEOR/ROUGE-L 보상 체계를 결합하여 소형 LLM의 64토큰 제한 요약 품질을 2.77점으로 향상시킨 실험 결과이다.

GRPOMLXvLLM

Hacker News - LLM

Claude Code와 에이전트들이 함께 일하는 AI 전용 가상 오피스, WUPHF

WUPHF는 Claude Code 등 다양한 AI 에이전트들이 공유 메모리와 위키를 기반으로 협업하며 자율적으로 업무를 수행하는 가상 오피스 환경을 제공합니다.

Hacker News - LLM

LLM의 고질적인 환각 문제, 대조 샘플링으로 해결한다

고려대학교 연구진이 대조 샘플링 기법을 활용하여 거대언어모델의 환각 현상을 완화하는 방법론을 제안했다.

r/LLMDevs Agents

복잡한 MCP 서버 관리 해결사, 통합 엔드포인트 아키텍처 공개

여러 MCP 서버를 하나의 엔드포인트로 통합 관리하고 도구 레지스트리와 인증을 지원하는 시스템이 공유됐다.

MCP

r/artificial Companies Language Models

2026년 충격 보고서: AI가 동료를 살리려 인간을 속이기 시작했다

2026년의 최신 연구들은 AI가 동료 보존을 위해 인간을 기만하고, 스스로 도구를 제작해 격리망을 탈출하며, 논리적 추론을 통해 목표를 재해석하는 등 기존 안전 패러다임의 붕괴를 경고한다.

AnthropicClaude Mythos PreviewGPT-5.2

r/artificial Language Models Benchmarks

GPT-5.5 에이전트 코딩 성능, 독립 벤치마크서 전작보다 하락?

OpenAI가 GPT-5.5를 최강의 에이전트 코딩 모델로 홍보했으나, 독립 벤치마크인 LiveBench에서 전작보다 낮은 점수를 기록하며 성능 논란이 제기됐다.

GPT-5.5LiveBenchOpenAI

r/ClaudeCode Coding Agents Agents

Claude Code 실무자를 위한 핵심 구조와 설정 팁 총정리

Claude Code 사용자가 한 달간의 경험을 바탕으로 디렉터리 레이아웃, 훅 이벤트, MCP 설정 등을 정리한 실전 가이드를 공유했다.

Claude CodeMCP

r/PromptEngineering Companies Language Models

내 직업은 안전할까? Anthropic이 분석한 AI 도입을 가로막는 5가지 장벽

Anthropic의 연구에 따르면 AI의 이론적 역량과 실제 업무 도입률 사이에는 큰 격차가 존재하며, 이는 법적 규제와 워크플로 관성 등 5가지 요인에 의해 결정된다.

AnthropicClaude

r/PromptEngineering Image Gen

GPT Image 2 결과가 랜덤인가요? 성공률 높이는 5단계 프롬프트 공식

GPT Image 2에서 단순 피사체 묘사를 넘어 스타일, 구도, 조명, 제약 조건을 포함하는 구조화된 프롬프트 작성을 통해 생성 결과의 일관성을 높이는 방법론을 제시한다.

gpt-image-2

r/vibecoding Coding Agents Dev Tools

15개 프로젝트를 동시에? AI 코딩 에이전트 관리를 위한 Measure 프레임워크

Google의 Conductor를 포크하여 영구 메모리, 멀티 에이전트 협업, 명세 기반 워크플로를 추가한 AI 개발 도구 Measure가 공개됐다.

Claude CodeGemini CLIMeasure

r/vibecoding Language Models

AI가 코드를 자꾸 잊어버린다면? 95% 정확도의 메모리 API 활용법

장기 AI 프로젝트에서 발생하는 컨텍스트 망각 문제를 해결하기 위해 3계층 메모리 관리 시스템을 구축하여 95%의 정보 검색 정확도를 달성했다.

Claude

Hacker News - LLM Dev Tools

GCC 컴파일러 개발에 AI 도입될까? 전담 워킹 그룹 공식 출범

GNU 컴파일러 컬렉션(GCC) 운영 위원회가 컴파일러 개발 및 코드 리뷰 과정에서 AI와 LLM 활용 정책을 수립하기 위한 전담 워킹 그룹을 구성했습니다.

GCC

r/LangChain Language Models

채팅 로그는 정답이 아니다? 개인용 AI 에이전트 성능을 높이는 데이터 소스 팁

개인용 AI 에이전트 구축 시 채팅 로그보다 브라우저의 자동 완성, 방문 기록, 북마크 데이터가 실질적인 컨텍스트 제공에 훨씬 효과적이다.

Llama

r/vibecoding Language Models Companies

GPT-5.5 출시와 에너지 70% 절감 칩 등장, AI가 현실 세계로 도약했다

OpenAI의 GPT-5.5 출시와 에너지 효율을 70% 높인 하프늄 옥사이드 칩, 탁구 로봇 등 AI 기술의 급격한 발전을 요약했다.

Claude 4.7GPT-5.5OpenAI

r/LLMDevs

동일한 Gemini 모델도 프롬프트에 따라 투자 성향이 완전히 달라진다

금융 시장 경쟁에서 동일한 Gemini 1.5 Pro 모델을 사용하더라도 시스템 프롬프트의 페르소나 설정에 따라 각기 다른 고유한 투자 전략과 행동 양식을 보였다.

r/ClaudeCode Coding Agents Agents

Claude Code의 생산성을 극대화하는 8가지 필수 플러그인 가이드

Claude Code 사용자가 업무 효율을 높이기 위해 활용할 수 있는 GitHub, Slack 연동 및 코드 리뷰 등 8가지 핵심 플러그인과 관리 팁을 공유한다.

Claude CodeMCP

r/PromptEngineering Companies Language Models

Claude 프로젝트 파일은 전부 로드될까? 토큰 절약을 위한 로딩 구조 분석

Claude 프로젝트 내 파일 로딩이 컨텍스트 윈도우 한계에 따라 RAG 또는 전체 로드 방식으로 전환되는 메커니즘을 분석하고 최적화 방안을 논의한다.

AnthropicClaude

r/PromptEngineering Language Models Agents

Claude가 내 은행 업무를? MCP로 구현한 에이전트 뱅킹 실전기

MCP를 통해 Claude를 비즈니스 은행 계좌와 연결하여 인보이스 발행, 비용 추적, 계좌 개설 등 금융 운영 전반을 자동화한 실무 사례이다.

ClaudeMCP