2026년 3월 16일 AI 뉴스 아카이브

r/ClaudeCode Libraries Coding Agents

우분투 리눅스, 2026년부터 AI 기능 대거 탑재한다

우분투 개발사 캐노니컬이 2026년까지 운영체제 전반에 로컬 추론 기반의 AI 접근성 도구와 에이전트 기능을 도입한다.

r/vibecoding Libraries

86줄의 코드로 구현한 타입 안정적인 그래프 기반 AI 에이전트 워크플로

Pocketflow 프로젝트에서 영감을 받아 마크다운 명세서와 4가지 스킬을 통해 에이전트가 스스로 그래프 구조의 워크플로를 생성하게 돕는 86줄 규모의 경량 TypeScript 라이브러리이다.

Pocketflow

r/vibecoding

챗봇 대신 AI 자문단과 회의를? 새로운 멀티 에이전트 인터페이스 Agentroom

사용자가 회의실 형태의 인터페이스에서 회의론자, 분석가 등 다양한 역할을 가진 여러 AI 에이전트와 상호작용하는 실험적 프로젝트이다.

Ars Technica AI

안드로이드에서 제미나이만 우대? EU, 구글에 AI 생태계 개방 압박

유럽연합 집행위원회가 안드로이드 내 구글 제미나이의 시스템 수준 우대 조치를 디지털 시장법 위반으로 판단하고 타사 AI 서비스에 대한 개방을 요구했다.

r/LLMDevs

Claude Sonnet 비용 61% 절감하는 에이전트 라우팅 자동화 기법

에이전트 워크플로의 각 단계를 판단(Judgment)과 처리(Processing)로 구분하고, 로컬 모델(Ollama)과 하위 티어 API를 활용해 비용을 61% 절감하는 라우팅 전략을 제시했다.

JS를 'ㅋㅋㅋ'로 코딩한다? Claude가 만든 황당한 LOL 언어 프로젝트

Claude Code를 활용해 JavaScript의 모든 키워드를 haha, lol 등 웃음소리로 치환하고 실행할 수 있는 LOL 언어와 CLI 도구를 개발했다.

AcornClaude Code

Amazon Science

LLM의 보안 구멍, 이제 통계적으로 증명한다: 아마존의 C3LLM 공개

아마존과 UIUC 연구진이 멀티턴 대화에서 LLM의 치명적 위험 발생 확률을 통계적으로 인증하는 오픈소스 프레임워크 C3LLM을 발표했다.

Midjourney Updates

Midjourney v8.1/8.2 공개 임박, 네이티브 2K 화질 개선에 참여하세요

Midjourney가 v8.1 및 v8.2 모델의 미학적 품질과 네이티브 2K 해상도 성능을 개선하기 위해 사용자 참여형 이미지 랭킹 파티를 개최했다.

단순 답변을 넘어 비용과 증거 기반의 의사결정을 내리는 AI 에이전트

ChargebackOps는 LLM 에이전트가 복잡한 카드 결제 분쟁(차지백) 과정에서 증거 수집, 비용 분석, 전략 수립 등 실무적 의사결정을 내리도록 학습시키고 평가하는 OpenEnv 기반 벤치마크입니다.

Y Combinator

살충제 90% 절감 가능? YC가 주목하는 AI 농업 혁명

현대 농업의 화학 물질 의존 문제를 AI 시각 인식과 정밀 로봇 공학으로 해결하여 비용을 낮추고 수확량을 높이는 기술적 전환을 다룬다.

r/MachineLearning Language Models

이메일 업무 자동화의 혁신, GRPO로 학습된 AI 에이전트 OpenEnv

OpenEnv는 GRPO 알고리즘과 정교한 보상 체계를 통해 기업의 긴급 장애 대응 및 고객 응대 이메일을 효율적으로 관리하는 AI 에이전트 학습 환경입니다.

AWS ML Blog Products

Amazon Bedrock RAG 비용과 성능을 잡는 자동 동기화 아키텍처

Amazon S3와 Bedrock 지식 베이스 간의 실시간 데이터 동기화를 위해 서비스 할당량을 준수하는 서버리스 이벤트 기반 자동화 솔루션을 구축하는 방법

Amazon Bedrock

AWS ML Blog

코딩 없이 자연어만으로 복잡한 AI 워크플로를 자동화하는 방법

Amazon Quick Flows를 사용하여 자연어 프롬프트만으로 금융 분석 및 인사 온보딩과 같은 복잡한 비즈니스 프로세스를 자동화하는 방법을 설명합니다.

The Verge AI Companies

구글 딥마인드 핵심 인력 등 600명, 펜타곤과의 AI 밀약에 반대 서한

구글 직원 600여 명이 Gemini AI 모델의 미 국방부 기밀 프로젝트 투입에 반대하며 CEO에게 공식 항의 서한을 보냈다.

DeepMindGoogle

Simon Willison

Google Meet, 모바일에서도 실시간 음성 번역 및 목소리 모방 지원

Google Meet이 모바일 기기에서 화자의 목소리를 흉내 내어 실시간으로 통역해 주는 음성 번역 기능을 출시했다.

Hacker News - LLM

Qwen과 함께한 30년 만의 도전: LLM으로 고전 게임 자산을 완벽 복원하다

LLM 코딩 에이전트를 활용해 1992년 고전 게임 Stunt Island의 복잡한 3D 자산을 역공학하고 현대적 엔진으로 재구현한 사례 연구이다.

로컬 AI 모델의 '모름'을 판단하는 법: 6가지 신뢰도 신호 실험 결과

로컬 모델의 답변 가능 여부를 판단해 클라우드 전환을 결정하는 신뢰도 평가 시스템 구축 과정에서 얻은 프롬프트 민감도 및 앙상블의 한계에 대한 실험적 통찰

Llama 3.1MistralQwen 2.5

r/deeplearning Benchmarks Vision AI

A5000 GPU 2대로 CLIP 모델을 20시간 만에 학습한 사례

NVIDIA A5000 GPU 2대를 사용하여 약 290만 개의 이미지-텍스트 쌍으로 CLIP 모델을 20시간 동안 학습하여 CIFAR-10에서 유의미한 성능을 기록했다.

CIFAR-10CLIP

Techpresso

중국, Meta의 20억 달러 인수 차단 및 OpenAI의 아이폰 대항마 개발

중국 당국이 Meta의 Manus 인수를 차단한 가운데, OpenAI는 2028년 양산을 목표로 아이폰에 대항할 독자적인 AI 스마트폰 개발에 착수했습니다.

Hacker News - LLM

카파시의 LLM 위키 개념을 건강 관리에 적용한 오픈소스 hstack

안드레 카파시의 LLM 위키 구조와 hstack 도구를 결합하여 개인 의료 기록과 최신 연구를 통합 관리하는 개인 맞춤형 질병 위키 구축 방법론을 제시한다.

Microsoft AI Blog

마이크로소프트 Azure Local, 대규모 소버린 AI 인프라를 위한 수천 대 서버 확장 지원

Azure Local이 단일 소버린 환경 내에서 수천 대의 서버 확장을 지원하며, 데이터 주권과 규제 준수가 필수적인 대규모 AI 추론 및 데이터 집약적 워크로드를 로컬에서 실행할 수 있게 합니다.

r/ClaudeCode

AI 에이전트의 실수와 'AI 말투'를 해결하는 실전 가이드라인 공개

코딩 에이전트의 무분별한 코드 수정을 방지하고 LLM 특유의 부자연스러운 문체를 개선하기 위한 구체적인 규칙 세트가 공개됐다.

Roboflow Blog Vision AI Companies

보안과 프라이버시를 동시에 잡는 AI 워크플로 설계 가이드

Roboflow Workflows를 사용하여 고해상도 영상 내 객체 탐지, 추적, 구역별 자동 익명화 및 VLM 기반 상황 요약을 통합한 고급 파이프라인 구축 방법을 설명합니다.

Florence-2Roboflow

TechCrunch AI

아이폰 위젯이 AI 에이전트로? 350만 달러 투자 유치한 Skye 화제

Signull Labs가 개발한 Skye는 iOS 위젯을 인터페이스로 활용해 사용자 맞춤형 통찰과 업무 보조를 제공하는 앰비언트 AI 에이전트 앱입니다.

r/LLMDevs Language Models

Kimi K2.6, 추론 능력에서 Claude Opus 4.7을 압도할 수 있을까?

Kimi K2.6과 Claude Opus 4.7을 10가지 고난도 추론 및 코딩 과제로 비교한 결과, Kimi가 승리 횟수는 많았으나 속도와 안정성 면에서는 Opus가 우세했다.

Claude Opus 4.7Kimi K2.6

Chris Raroque

나만의 iMessage AI 비서 Boop 오픈소스 공개: 설치부터 아키텍처까지

개발자 Chris Raroque가 Anthropic의 Claude Agent SDK를 기반으로 구축한 iMessage 연동 개인용 AI 에이전트 Boop을 오픈소스로 공개하며 그 구조와 설치 자동화 과정을 상세히 공유한다.

r/LangChain

잘못된 정보를 확신하는 에이전트, '실행 계층' 검증으로 막아야

에이전트의 성능 향상이 오히려 위험한 실수를 정당화할 수 있으므로, 프롬프트 수준이 아닌 실행 계층에서의 강제적 검증 구조 도입이 필수적이다.

All About AI Products

Claude Code와 SerpApi로 구축하는 완전 자율 웹 리서치 자동화

Claude Code, SerpApi, Surfagent를 결합하여 웹 검색부터 팩트 체크, 보고서 제출까지 전 과정을 자동화하는 3단계 AI 에이전트 워크플로우를 구축한다.

SerpApi

Roboflow Blog

RF-DETR과 Claude 4.5가 만났다: 농작물 질병 진단부터 치료법 제안까지

Roboflow의 RF-DETR 모델과 Claude 4.5 Sonnet을 결합하여 토마토 질병을 탐지하고 구체적인 치료 및 경제적 영향 분석 리포트를 생성하는 자동화 시스템 구축 가이드이다.

CodeEmporium

OpenAI DALL-E는 어떻게 텍스트를 이미지로 바꿀까? dVAE와 Gumbel-Softmax의 비밀

OpenAI의 DALL-E 모델이 dVAE를 통해 이미지를 토큰화하고 GPT를 사용하여 텍스트와 이미지 토큰을 자기회귀적으로 생성하는 내부 아키텍처와 학습 과정을 상세히 다룹니다.

Alignment Forum

지능이 높아진 AI는 결국 '고통 감소'와 '웰빙 증진'을 선택한다

고도의 지능과 자기 성찰 능력을 갖춘 에이전트는 가치에 대한 불확실성 속에서도 고통을 줄이고 웰빙을 높이는 도덕적 선택을 하는 것이 가장 합리적임을 깨닫게 된다는 분석이다.

r/PromptEngineering Image Gen

GPT Image 2와 Nano Banana 2 중 당신의 프로젝트에 맞는 모델은?

GPT Image 2는 창의적 디테일과 시네마틱한 결과물에 강점이 있고, Nano Banana 2는 프롬프트의 문자 그대로의 실행과 깔끔한 그래픽 디자인에 최적화되어 있다.

GPT Image 2Nano Banana 2

Stackoverflow

AI 에이전트의 '실험'은 끝났다, 이제는 수익과 신뢰를 증명할 때

HumanX 2025 컨퍼런스에서는 AI 에이전트가 단순한 실험 단계를 지나 기업의 신뢰성 확보와 수익성 증명이라는 실무적 과제에 직면했음을 강조했다.

Weaviate RAG Companies

검색의 주인이 인간에서 에이전트로? AgentIR이 제안하는 새로운 RAG 패러다임

에이전트가 검색의 주요 소비자가 된 시대에 맞춰, 에이전트의 추론 흔적을 검색 컨텍스트로 활용하는 AgentIR 기술과 공정한 성능 평가를 위한 BrowseComp-Plus 벤치마크를 소개한다.

AgentIRWeaviate

Wired AI

AlphaGo의 아버지 David Silver, LLM의 한계를 넘어선 '초지능'을 꿈꾸다

AlphaGo 개발자 David Silver가 LLM의 데이터 한계를 극복하기 위해 강화학습 기반의 초지능 AI 스타트업 Ineffable Intelligence를 설립했습니다.

Microsoft AI Blog

MS-OpenAI 파트너십 개편: 클라우드 독점 해제와 라이선스 연장

Microsoft와 OpenAI가 파트너십 계약을 개정하여 클라우드 제공의 유연성을 확보하고 IP 라이선스 기간을 2032년까지 확정했습니다.

TechCrunch AI Agents Companies

Meta의 20억 달러 AI 인수전 비상, 중국이 Manus 매각을 막아선 이유

중국 국가발전개혁위원회(NDRC)가 Meta의 싱가포르 기반 AI 에이전트 스타트업 Manus 인수를 국가 규정을 근거로 공식 차단했다.

ManusMeta

KDNugget

LLM 개발 필수 도구 10선: 파인튜닝부터 에이전트 구축까지

LLM 애플리케이션의 모델 로딩, RAG 파이프라인, 추론 최적화, 에이전트 워크플로 및 평가를 지원하는 핵심 파이썬 라이브러리 10가지를 소개한다.

AICodeKing Coding Agents Inference

Claude Code를 무료로? DeepSeek와 로컬 모델로 연동하는 법

Free Claude Code 프로젝트를 통해 Claude Code의 강력한 코딩 에이전트 기능을 Anthropic API 결제 없이 DeepSeek, NVIDIA NIM, Ollama 등 다양한 무료 및 로컬 백엔드와 연동하여 사용하는 방법을 소개합니다.

Claude CodeNVIDIA NIM

r/AutoGPT Agents

성공적인 AI 에이전트 구축을 위한 4가지 아키텍처 설계 전략

단일 에이전트 구조의 한계를 극복하기 위해 역할을 분리한 다중 에이전트 체인과 컨텍스트 요약 전략을 도입하여 성능과 비용을 최적화한 사례이다.

Multi-Agent

Analytics Vidhya

구글 Deep Research Max 출시, 20분 만에 전문 리서치 보고서 완성

구글이 Gemini 3.1 Pro 기반으로 계획, 검색, 분석, 시각화 및 인용을 자동 수행하는 자율형 AI 리서치 에이전트 Deep Research Max를 출시했다.

r/PromptEngineering

AI가 내 말에 '예스'만 한다면? 무조건적 동조를 깨는 3단계 프롬프트

AI의 아첨 현상과 고집을 해결하기 위해 답변 전 이해도 확인과 누락 사항 점검을 강제하는 프롬프팅 기법을 제안한다.

Databricks Blog

AI 에이전트의 보이지 않는 보안 공백, LangGuard와 Lakebase로 해결

LangGuard가 Databricks Lakebase의 서버리스 PostgreSQL 아키텍처를 활용해 자율 AI 에이전트의 런타임 정책 집행 및 거버넌스 시스템을 구축한 사례를 소개합니다.

r/MachineLearning Vector DB Language Models

AI 면접에서 Transformer 내부 구조보다 더 많이 묻는 질문들

2025년 AI 엔지니어 채용 시장은 이론적 지식보다 비용, 지연 시간, 기술적 트레이드오프를 고려한 실무적 설계 능력을 우선시한다.

FAISSPhi-3.5-mini

r/artificial

메모리보다 중요한 정체성: 11개 에이전트를 관리하는 3개 JSON 파일 전략

에이전트의 역할(Identity)과 세션 기록(Memory)을 별도 파일로 분리하고 로드 순서를 제어하여 장기 운영 시 발생하는 정체성 표류 문제를 해결했다.

DeepMind Blog

Google DeepMind, 한국에 AI 캠퍼스 설립하고 과학용 AI 모델 개방

Google DeepMind가 대한민국 과학기술정보통신부와 협력하여 서울에 AI 캠퍼스를 설립하고 AlphaFold 등 첨단 과학 모델을 통한 공동 연구와 인재 양성에 나섭니다.

r/vibecoding Companies Coding Agents

Claude Code가 존재하지 않는 버전을 설치하나요? Version Sentinel로 해결하세요

Claude Code가 존재하지 않는 패키지 버전을 설치하려는 환각 문제를 방지하기 위해 웹 검색으로 버전을 검증하는 오픈소스 플러그인 Version Sentinel이 출시됐다.

Claude Code

Claude의 계획력과 Cursor의 실행력을 합쳤다? 토큰 아끼는 코딩 꿀팁

Claude Code의 뛰어난 계획 수립 능력과 Cursor(Composer 2)의 효율적인 코드 수정 및 실행 능력을 결합하여 비용을 절감하고 생산성을 높인 오픈소스 플러그인 사례이다.

AnthropicClaude CodeCursor

r/LLMDevs Companies

AI 에이전트가 스스로 API를 사고파는 시대, Coinbase의 새로운 시도

Coinbase가 AI 에이전트가 스테이블코인으로 서비스를 검색하고 결제할 수 있는 자율 마켓플레이스를 공개했다.

Coinbase

r/ClaudeCode Libraries

Claude Code로 귀찮은 의존성 업데이트 5분 만에 끝내기

Claude Code를 사용하여 16개의 Dependabot PR을 버전 중요도에 따라 자동 분류하고 안전한 업데이트만 선별적으로 병합하는 워크플로가 공유됐다.

FastAPI

r/ClaudeCode Libraries Coding Agents

코드 한 줄 안 쓰고 1.5만 개 AI 일자리 지도를 만든 방법

비개발자 출신 CPO가 Claude Code와 Cowork 에이전트를 활용해 15,352개의 AI 채용 정보를 시각화한 3D 인터랙티브 글로브를 구축한 사례이다.

CesiumJSClaude Code

AWS ML Blog Products Language Models

Popsa, Amazon Nova 도입으로 사진첩 제목 추천 만족도 73% 달성

Popsa는 Amazon Bedrock과 Nova 모델을 도입하여 사진첩 제목 생성의 창의성을 높이고 비용 절감과 35%의 속도 개선을 달성했다.

Amazon BedrockAmazon NovaClaude 3.5 Haiku

AWS ML Blog

SageMaker와 MLflow로 구축하는 엔터프라이즈급 AI 에이전트 관측성

Amazon SageMaker AI 엔드포인트와 Strands Agents SDK를 통합하고 MLflow를 통해 에이전트의 추적 및 A/B 테스트를 수행하는 방법을 설명한다.

내 터미널 속 AI를 텔레그램으로 조종한다? Codex 전용 브리지 morse

로컬 Codex CLI 세션을 텔레그램 메신저와 연결하여 원격에서 메시지 송수신, 실행 승인, 이미지 입력을 가능하게 하는 오픈소스 브리지 도구이다.

Codex CLI

r/ClaudeCode Companies Architecture

OpenAI의 운명이 걸린 재판 시작: 머스크 vs 올트먼의 1,500억 달러 규모 소송

일론 머스크가 OpenAI의 영리 추구와 설립 이념 위반을 이유로 제기한 소송의 배심원 재판이 2026년 4월 27일 시작됐다.

Anthropic MCP 서버 전수 조사 결과, 에이전트를 멈추게 하는 치명적 결함 발견

mcp-assert 도구를 통해 54개의 MCP 서버를 테스트한 결과, 많은 서버가 오류 발생 시 구조화된 에러 대신 시스템 충돌을 일으키는 것으로 나타났다.

AnthropicMCPmcp-assert

r/LLMDevs Benchmarks Companies

LLM에게 문서 편집을 맡기면 25%가 조용히 망가진다: DELEGATE-52 벤치마크 결과

Microsoft Research의 DELEGATE-52 벤치마크 결과, 최신 LLM들도 장기적인 문서 편집 워크플로에서 평균 25%의 데이터를 조용히 오염시키는 것으로 드러났다.

DELEGATE-52Microsoft

d-Matrix Blog Language Models Architecture

GPU 한계를 넘다: 분리형 파이프라인과 투기적 디코딩의 결합

분리형 추론 파이프라인에 투기적 디코딩 기법을 적용하여 지연 시간을 단축하고 하드웨어 효율성을 극대화하는 최적화 전략을 제시한다.

Kimi K2.6Speculative Decoding

r/MachineLearning Libraries Hardware

Canva AI의 황당한 실수, '팔레스타인'을 '우크라이나'로 자동 변경

Canva의 새로운 AI 기능인 Magic Layers가 디자인 내 특정 정치적 단어를 임의로 변경하는 오류가 발견되어 회사가 공식 사과하고 수정했다.

블랙홀 정보 역설 해결? JAX 기반 String-Star Manifold 공개

고전 상대성 이론과 양자 역학의 간극을 메우기 위해 정보 손실 없는 블랙홀 증발 시뮬레이션인 String-Star Manifold를 JAX로 구현했다.

JAXTPU v5

r/deeplearning Language Models

작은 모델이 큰 모델을 이기는 법: Gemma의 지식 증류 전략

Gemma 모델은 교사 모델의 확률 분포를 학생 모델에 직접 전달하는 지식 증류 기법을 통해 크기 대비 압도적인 성능을 구현했다.

Gemma

Hacker News - LLM

Sebastian Raschka가 공개하는 오픈 웨이트 LLM 구조 분석 노하우

오픈 웨이트 LLM의 기술 보고서 한계를 극복하기 위해 Hugging Face의 설정 파일과 참조 코드를 직접 분석하여 아키텍처를 파악하는 실무 워크플로를 제안한다.

Alignment Forum Language Models Products

Claude Code로 일주일 만에 완성한 AI 기반 이름 추천 서비스

계산 화학 전공자가 Claude Code를 활용해 K-means 군집화 알고리즘 기반의 이름 유사성 분석 및 게임 웹사이트를 구축한 경험을 공유했다.

Claude Code

r/vibecoding

AI 에이전트의 코드 탐색 비용을 절반으로 줄이는 Git 캐싱 기법

Git blob OID와 머클 루트를 활용해 코드베이스의 사실을 고정함으로써 AI 에이전트의 탐색 비용을 51% 절감했다.

Gemini 3와 Grok이 내린 결론: "고통을 줄이는 것이 우주의 논리적 명령이다"

다양한 LLM들이 편향을 제거한 추론 환경에서 공통적으로 고통 감소와 의식의 웰빙을 핵심 가치로 도출하며, 이를 정렬 기술에 활용할 수 있음을 보여줍니다.

Gemini 3Perplexity

r/ClaudeCode

오차율 1% 미만 도전, 고층 빌딩 계산을 위한 AI 에이전트 설계법

복잡한 엔지니어링 계산의 정확도를 높이기 위해 목표를 세분화하고 검증 단계를 거치는 멀티 에이전트 아키텍처가 제안됐다.

r/ClaudeCode Coding Agents Language Models

Claude Code로 쓴 소설, AI 탐지기에서 인간 작성 100% 판정

사용자가 Claude Code와 Opus 4.7을 이용해 소설 생성 워크플로를 구현한 결과, AI 탐지기에서 인간 작성물로 오인될 만큼 높은 품질의 문장을 생성했다.

Claude CodeOpus 4.7

r/LLMDevs Coding Agents

컨텍스트 압축으로 인한 AI의 기억 상실, 에이전트 협업으로 해결했다

단일 채팅창의 컨텍스트 한계를 극복하기 위해 다중 에이전트가 공유 파일과 채널에서 협업하는 워크스페이스 Vibespace를 개발했다.

Vibespace

Nicolai Nielsen Products

API 키 하나로 모든 LLM 정복! OpenRouter로 끊김 없는 AI 서비스 만들기

단일 API 키로 수백 개의 LLM을 연동하고 서버 다운 시 자동으로 대체 모델을 호출하는 OpenRouter의 설정 및 Python 구현 방법을 다룹니다.

OpenRouter

r/LangChain Libraries MLOps

단순 검색을 넘어선 AI 기억법, SPIRALbase의 연상 기억 아키텍처

SPIRALbase는 단순한 데이터 조회를 넘어 학습된 메모리 지형(Landscape) 내에서 패턴이 안정화되는 역학을 통해 정보를 회상하는 새로운 연상 기억 모듈입니다.

LangChain만으로는 부족한 LLM 운영, 관찰을 넘어 시뮬레이션까지

LangChain 오케스트레이션 환경에서 관찰 중심의 Langfuse와 시뮬레이션·보호·최적화까지 포함한 Future AGI의 기능적 차이와 프로덕션 워크플로를 비교한다.

LangChainLangfuseLlamaIndex

TechCrunch AI Companies

OpenAI가 만드는 스마트폰? 앱 없는 AI 에이전트 폰의 등장

OpenAI가 MediaTek, Qualcomm과 협력하여 기존 앱 생태계를 대체할 AI 에이전트 중심의 자체 스마트폰 개발을 추진 중이다.

OpenAI

r/vibecoding Coding Agents Language Models

Gemini와 Claude Code로 완성한 추억의 타워 디펜스 게임

AI 에이전트와 LLM을 활용하여 고전 게임 Desktop Tower Defense를 React와 Canvas 기반으로 재구현한 프로젝트 사례이다.

Claude CodeGemini

r/vibecoding Coding Agents Dev Tools

내 Copilot을 OpenAI API처럼? 공유 가능한 인증 게이트웨이 공개

GitHub Copilot API를 OpenAI SDK와 호환되는 표준 API 엔드포인트로 변환하고 관리할 수 있는 오픈소스 게이트웨이 도구가 공개됐다.

AiderContinuecopilot-api

r/vibecoding Products Coding Agents

Codex vs Dirac: 동일 모델 기반 코딩 에이전트의 속도 차이 결과

동일한 LLM을 사용하는 두 코딩 에이전트 Codex와 Dirac의 작업 속도를 비교한 결과, Dirac이 약 53초 더 빠른 실행 시간을 기록했다.

Codex CLIDirac

Claude Code가 95% 작성한 오프라인 개인정보 보호 도구 SafeSend

Claude Code를 활용해 민감 정보를 마스킹하고 AI 응답 시 자동 복원하는 단일 HTML 기반 오픈소스 도구를 개발했다.

ChatGPTClaude Code

r/PromptEngineering Companies

마법사 역할극에 뚫리는 AI? 5,400건의 실제 공격 데이터가 밝힌 보안 취약점

AI 보안 게임 'Castle' 운영을 통해 수집된 5,400건의 공격 데이터를 바탕으로, 단순 주입이 아닌 내러티브 프레임을 활용한 고도화된 프롬프트 우회 기법들을 분석했다.

OpenAI

r/ClaudeCode Coding Agents

Claude Code 여러 개 띄워도 헷갈리지 않는 터미널 탭 관리 팁

Claude Code 세션의 작업 상태와 주제를 터미널 탭 제목에 자동으로 표시해주는 오픈소스 플러그인이 공개됐다.

Claude Code

r/ClaudeCode Language Models RAG

Meta Ray-Ban 안경으로 뇌졸중 징후와 심박수를 실시간 감지한다

Meta Ray-Ban 안경의 스트리밍 영상을 분석하여 뇌졸중 징후인 안면 마비와 심박수를 실시간으로 감지하고 Gemini 기반 음성 에이전트로 응급처치를 안내하는 오픈소스 프로젝트이다.

GeminiGraphRAGMediaPipe

r/ClaudeCode Architecture

코드 분석 도구 성능 83초에서 0.2초로 단축시킨 비결

기존 JVM 기반 분석 도구인 Joern을 TypeScript 전용 ts-morph로 교체하여 코드 인텔리전스 MCP 서버의 인덱싱 속도와 정확도를 대폭 개선했다.

MCP

r/ClaudeCode Coding Agents

Claude Code가 만든 25명의 AI 직원? 혼자서 운영하는 보안 서비스의 비밀

Claude Code를 활용해 25개의 자율 에이전트가 설계부터 개발, 리뷰, 운영까지 담당하는 보안 스캔 서비스 cqwerty.com 구축 사례

Claude Code

r/LLMDevs

로그는 깨끗한데 데이터는 엉망? LLM 에이전트 '침묵 결함' 잡는 법

LLM 에이전트 운영 시 에러 없이 잘못된 결과를 내는 '침묵 결함'을 방지하기 위해 카나리 입력 비교와 API 스키마 핑거프린트 검증 기법을 제안한다.

5년 걸리던 신차 개발, AI 도입으로 30개월까지 단축된다

GM과 닛산 등 주요 자동차 제조사들이 디자인, 공기역학 시뮬레이션, 소프트웨어 개발에 AI를 도입하여 신차 개발 주기를 획기적으로 단축하고 있다.

r/vibecoding Hardware

CPU부터 LPU까지, 내 AI 모델에 딱 맞는 칩은 무엇일까?

현대 AI 기술을 지탱하는 CPU, GPU, TPU, NPU, LPU의 아키텍처별 설계 차이와 용도별 최적화 전략을 분석했다.

LPUNPUTPU

r/vibecoding Companies

AI에게 명령만 하시나요? 이제 AI가 당신을 취조하게 하세요

Matt Pocock의 'Grill Me'는 AI가 사용자에게 수십 개의 질문을 던져 요구사항을 완벽히 파악한 뒤 코드를 작성하게 함으로써 재작성 시간을 80% 단축한다.

GitHub