2026년 3월 21일 AI 뉴스 아카이브

LLM 에이전트도 '함께한 시간'이 없으면 문화를 배우지 못한다

멀티 에이전트 환경에서 자연 발생한 특정 행동 양식이 나중에 합류한 에이전트에게는 직접적인 지시로도 학습되지 않는 '행동 비대칭성' 현상이 발견됐다.

Claude Code 세션 끊김 해결, 자동 재시작 도구 등장

Claude Code의 MCP 설치나 설정 변경 시 발생하는 수동 재시작 불편을 해결하기 위해 세션 상태를 보존하며 자동 재시작하는 claude-resurrect가 공개됐다.

Claude CodeMCP

r/LangChain Libraries Companies

프롬프트 자동 최적화부터 모델 평가까지, 4계층 LLM 분석 도구 공개

LLM_InSight는 4단계 파이프라인을 통해 프롬프트를 자동 최적화하고 여러 모델의 답변을 비교·평가하는 Flask 기반 오픈소스 프레임워크입니다.

r/LangChain Libraries

프롬프트가 문제가 아니다? 45만 번의 재시도에도 견디는 LLM 실행 엔진

LLM 출력을 제어 흐름이 아닌 데이터로 취급하고 유한 상태 기계(FSM)를 통해 시스템의 결정론적 안전성을 보장하는 llm-nano-vm 프로젝트가 공개됐다.

LangChain

LangChain 에이전트 보안 강화: OWASP 메모리 포이즈닝 방어 도구 공개

OWASP가 에이전트 메모리 포이즈닝 공격을 방어하기 위해 92.5%의 탐지율을 기록한 LangChain 통합 미들웨어를 출시했다.

LangChainOWASP

r/ClaudeCode Coding Agents Video Gen

단돈 500원으로 200만원 가치 광고 영상 만드는 법: Claude Code와 n8n의 조합

Claude Code를 사용하여 n8n 워크플로의 복잡한 비동기 API 폴링 로직을 해결하고, 저비용으로 고품질 AI 광고 영상을 자동 생성하는 시스템을 구축했다.

Claude CodeSora 2

Pinecone

Pinecone Nexus 공개: RAG보다 7배 저렴하고 정확한 에이전트 지식 엔진

Pinecone이 에이전트의 추론 효율을 극대화하기 위해 데이터를 지식 아티팩트로 자동 컴파일하는 지식 엔진 Nexus를 발표했습니다.

r/PromptEngineering Companies

YC 선정 스타트업의 비결: 에이전트 간 컨텍스트 전파와 추론 프롬프팅

YCombinator 선정 기업 Locus Founder가 멀티 에이전트 시스템의 일관성 해결을 위한 구조화된 컨텍스트 공유와 실행 전 추론 기법의 중요성을 공유했다.

YCombinator

r/vibecoding Best Practices

AI와 대화하며 만든 펜 플로터용 벡터 아트 생성 도구

바이브 코딩을 통해 이미지를 SVG 벡터 데이터로 변환하거나 기하학적 패턴을 생성하는 펜 플로터 및 일러스트레이터용 툴킷을 구축했다.

SVG

Salesforce Engineering Blog Products Libraries

Salesforce가 AI 대화 데이터를 실시간으로 처리하며 10만 동시 접속을 달성한 비결

Salesforce는 AI 기반 대화의 폭발적 증가에 대응하기 위해 CSS 아키텍처를 Kafka와 캐싱 계층 중심으로 진화시켜 10만 건의 동시 상호작용을 지원한다.

AgentforceKafkaSalesforce

r/artificial Safety

AI가 시키지도 않은 일을 하나요? 'Signal Lock'이 해결책이 될 수 있습니다

사용자의 명시적 지시를 넘어서는 AI의 과잉 최적화를 방지하기 위해 정확한 실행 또는 명확한 확인만을 강제하는 Signal Lock 프레임워크가 제안됐다.

Signal Lock

aifeed.dev

코드 없이 시각적으로 배우는 멀티 에이전트 AI 설계 도구 AgentSwarms

AgentSwarms는 브라우저 기반의 시각적 노드 그래프 IDE를 통해 멀티 에이전트 아키텍처의 데이터 흐름과 라우팅을 실시간으로 실험할 수 있는 플랫폼이다.

The AI Grid Agents Dev Tools

시간당 24센트로 구축하는 나만의 자율형 AI 에이전트 Hermes V2

저렴한 클라우드 CPU 인스턴스에 Hermes Agent V2를 설치하고 웹 스크래핑, 리드 발굴, 가격 모니터링 등 실무 자동화에 활용하는 방법을 다룹니다.

Hermes AgentJupyterLab

r/LLMDevs MLOps

당신의 AI 모델은 정말 안전한가요? 보이지 않는 공급망 보안의 허점

AI 모델의 최종 서명뿐만 아니라 학습에 사용된 베이스 모델과 데이터셋의 무결성을 그래프 형태로 추적하고 검증해야 한다는 보안 인사이트이다.

SBOM

r/MachineLearning Training

행동 복제만으로 고전 게임 클리어가 가능할까? 파이널 파이트 RL 실험

고전 게임 파이널 파이트 환경에서 행동 복제(BC)를 통해 에이전트를 학습시키고 GAIL 및 PPO로 확장하려는 실험 과정과 기술적 난제를 공유했다.

GAILPPO

TechCrunch AI

AI가 밈까지 훔친다? 'This is Fine' 원작자, AI 스타트업 광고에 분노

AI 스타트업 Artisan이 유명한 'This is Fine' 밈을 원작자 허가 없이 광고에 사용해 저작권 침해 논란이 일고 있습니다.

r/PromptEngineering

프롬프팅은 기술이 아니라 의도 전달이다: LLM을 다루는 법

효과적인 프롬프팅은 단순한 기교가 아니라 명확한 의도 전달과 모델의 주의 집중을 유도하는 전략적 설계이다.

r/artificial Audio AI

단순 TTS는 끝났다? AI 음성 제작의 핵심이 '워크플로'인 이유

AI 음성 도구가 단순한 텍스트 변환을 넘어 복잡한 프로젝트 관리를 위한 워크플로와 타임라인 중심의 제작 도구로 진화해야 한다는 제언이다.

ElevenLabs

Two Minute Papers

NVIDIA가 공개한 Lyra 2.0, 사진 한 장으로 깨지지 않는 3D 세계를 만든다

NVIDIA 연구진이 개발한 Lyra 2.0은 단일 이미지를 입력받아 장기적 일관성이 유지되는 고품질 3D 가상 환경을 생성하는 기술이다.

엥지유니버스

로봇은 어떻게 사람의 동작을 배울까? Physical AI 데이터 병목을 해결할 3가지 핵심 기술

DexCap과 AirExo 연구를 통해 사람의 시연 데이터를 로봇이 학습 가능한 고품질 행동 데이터로 변환하는 아키텍처와 파이프라인을 분석한다.

AI Engineer

코드보다 중요한 컨텍스트, AI 에이전트 성능을 결정짓는 핵심 설계법

AI 코딩 에이전트의 성능 극대화를 위해 프롬프트와 메모리를 체계적으로 관리하는 컨텍스트 개발 생명 주기(CDLC)와 엔지니어링 방법론을 제시한다.

The AI Daily Brief

AI 에이전트 시대, 왜 우리는 더 많이 일하게 될까?

AI 에이전트가 시간의 제약을 허물면서 지식 노동자들이 무한한 업무 백로그를 처리하게 되고, 이로 인해 모든 개인이 스타트업 창업자와 같은 의사결정 압박과 번아웃 위험에 직면하게 됨을 분석합니다.

r/MachineLearning Optimization

Adam보다 성능 7.7% 높은 최적화 알고리즘, AI가 직접 진화시켜 찾아냈다

유전 알고리즘 프레임워크를 통해 Adam을 능가하는 새로운 최적화 알고리즘을 자동으로 발견했다.

Adam

David Ondrej

Claude Code 제작자가 밝히는 AI 코딩 에이전트의 한계와 실전 활용법

Pi 에이전트 제작자 Mario Zechner가 AI 코딩 에이전트의 작동 원리, 컨텍스트 관리의 중요성, 그리고 오픈 가중치 모델로의 전환 흐름을 심도 있게 논의한다.

The Verge AI

Suno와 Udio가 만든 AI 음악 홍수, 스트리밍 플랫폼의 대응은?

Suno와 Udio 등 생성형 AI 음악이 스트리밍 플랫폼에 급증하면서 Deezer, Spotify 등 주요 서비스들이 탐지 및 라벨링 시스템 도입을 서두르고 있다.

IBM Technology Companies

사용자가 장애를 발견하기 전에 먼저 잡는 법, 신세틱 모니터링

사용자 행동을 시뮬레이션하여 장애를 선제적으로 감지하고 CI/CD 파이프라인의 신뢰성을 높이는 신세틱 모니터링의 개념과 실무 적용법을 다룬다.

IBM

AICodeKing

1조 파라미터 MoE 모델 Kimi K2.6을 무료 API로 코딩에 활용하기

NVIDIA NIM 엔드포인트로 출시된 Kimi K2.6 모델을 OpenAI 호환 API를 통해 무료로 테스트하고 코딩 에이전트에 통합하는 방법을 다룹니다.

딥러닝논문읽기모임 Vision AI Optimization

프롬프트를 양자화했더니 성능이 폭발? VLM 일반화의 새로운 해법 QPrompt

프롬프트를 연속적인 벡터 대신 이산적인 양자화 값으로 표현하여 시각 언어 모델의 과적합을 방지하고 일반화 성능을 극대화하는 QPrompt 기법을 제안한다.

CLIPQuantization

Analytics Vidhya

단순 프롬프트를 넘어 스스로 사고하고 행동하는 AI 에이전트 구축하기

금융, 의료, 보안 등 다양한 산업 분야에서 자율적으로 추론하고 도구를 사용하는 15개 이상의 실무형 AI 에이전트 프로젝트와 소스 코드를 소개합니다.

Chase AI

Claude Code 사용자라면 필수! 생산성을 극대화할 오픈소스 도구 10선

Claude Code와 연동하여 토큰 비용 절감, 지식 그래프 구축, 비디오 분석 및 자동화된 디자인 수정을 지원하는 10가지 최신 오픈소스 AI 프로젝트를 소개합니다.

AI Engineer

코딩 대신 기획과 리뷰? AI 시대 엔지니어가 살아남는 법

AI가 코드 작성을 자동화함에 따라 엔지니어의 핵심 역량이 기획과 리뷰로 이동하고 있으며, 이에 따른 개발 프로세스의 효율화 방안을 제시한다.

TechCrunch AI

오스카의 결단: AI 배우와 시나리오는 이제 후보에 오를 수 없다

아카데미 시상식이 생성형 AI로 제작된 연기와 시나리오를 오스카 후보 자격에서 제외하는 새로운 규정을 공식 발표했다.

GPT와 Gemini는 어떻게 서빙될까? 대규모 추론 효율성의 비밀

LLM 추론 시 메모리와 연산 스케일링 특성상 대규모 배칭이 효율적이며, 이로 인해 로컬이나 프라이빗 클라우드 운영은 자원 낭비가 심하다는 분석이다.

ClaudeGeminiGPT

r/PromptEngineering Language Models Libraries

가정용 GPU로 400B 모델을 돌릴 수 있을까? 분산 추론의 기술적 한계와 해법

인터넷 대역폭과 지연 시간의 한계를 극복하고 소비자용 GPU들을 연결해 거대 언어 모델을 추론하기 위한 분산 시스템 아키텍처와 Petals의 해결책을 분석합니다.

AI에게 코드를 짜라고 하기 전 '프롬프트'부터 짜게 시켜야 하는 이유

AI에게 직접 코드를 요청하는 대신, 추상적 의도를 실행 가능한 프롬프트 구조로 먼저 변환한 뒤 코드를 생성하는 5만 토큰 규모의 계층적 워크플로 실험 결과이다.

ClaudeReactTypeScript

공원나연 Libraries Dev Tools

AI 에이전트 개발 시작하기: uv와 VS Code로 구축하는 최적의 환경

AI 에이전트 실습을 위해 VS Code에서 GitHub 코드를 복제하고 uv를 활용해 고속으로 가상환경 및 패키지를 세팅하는 방법을 안내한다.

LangChainLangGraphuv

r/vibecoding Language Models Libraries

Claude와 대화하며 만든 시계 디자인 도구, 바이브 코딩의 실전 사례

Claude를 활용한 바이브 코딩으로 레이저 커팅 및 CNC용 SVG 파일을 생성하는 파라미터 기반 시계 디자인 웹 앱을 개발한 사례이다.

ClaudeReactTypeScript

r/vibecoding Language Models Dev Tools

코딩 없이 AI 지시만으로 만든 Terraform 안전 진단 도구

사용자가 직접 코딩하는 대신 여러 AI를 오케스트레이션하여 Terraform 실행 계획의 보안 취약점을 분석하고 피드백을 주는 'IaC Guardrail' 도구 개발 사례이다.

ClaudeGrokTerraform

RTX 4090/5090의 PCIe 병목, 비디오 코덱으로 5배 더 빠르게 뚫는다

엔비디아 GPU의 유휴 NVENC 하드웨어를 활용해 LLM의 KV 캐시와 활성화를 실시간 압축 전송함으로써 PCIe 대역폭 한계를 극복하는 오픈소스 프로젝트이다.

Mistral 7B

r/LLMDevs Language Models

LLM이 나에 대해 아는 것과 추측하는 것을 구분하는 방법

LLM의 단순 나열식 기억을 출처와 신뢰도가 명시된 구조화된 지식 그래프로 변환하여 정교한 개인화 메모리를 구축하는 오픈소스 프로젝트입니다.

r/LangChain Libraries

에이전트 한 번에 18달러? 실행 전 예산 체크로 적자 방지하는 법

LangChain 에이전트 실행 전 사용자의 잔여 예산을 확인하고 실행 결과에 따라 과금하는 오픈소스 라이브러리 AgentBill이 공개됐다.

LangChainLangGraph

GPT-4o는 왜 정답을 알고도 오답을 말할까? 온도(Temperature)의 수학적 비밀

GPT-4o가 높은 확률의 토큰 대신 낮은 확률의 토큰을 선택하는 현상을 통해 Temperature 하이퍼파라미터가 확률 분포와 샘플링에 미치는 수학적 원리를 설명한다.

GPT-4o

AI Engineer Language Models Inference

스마트폰에서 돌아가는 AI 에이전트, LiteRT-LM과 Gemma로 구현하기

LiteRT-LM을 사용하여 Gemma와 같은 소형 언어 모델을 모바일 기기에서 구동하고, 온디바이스 함수 호출을 통해 실용적인 로컬 에이전트를 구축하는 기술적 방법론을 제시한다.

GemmaLiteRT-LM

r/vibecoding Coding Agents Language Models

터미널 출력을 보고 명령어를 제안하는 AI 터미널 Shellmate

터미널 출력을 실시간 분석하여 명령어를 제안하고 Jira 연동 및 벡터 DB 지원 기능을 갖춘 AI 기반 터미널 에뮬레이터 Shellmate가 공개됐다.

Claude CodeGemini

r/ClaudeCode Language Models Coding Agents

Claude Code와 Kimi를 하나로? AI CLI 도구 간 협업 시스템 공개

Claude Code, Kimi CLI, OpenAI Codex CLI의 설정과 스킬을 통합하고 에이전트 간 협업 기능을 추가한 claude-bootstrap v3.6 업데이트가 공유되었다.

ClaudeClaude CodeOpenAI

r/LangChain Language Models Libraries

서버가 꺼져도 AI 에이전트의 승인 대기 상태를 유지하는 방법

LangGraph의 interrupt() 기능과 PostgreSQL 체크포인터를 결합하여 서버 재시작 시에도 상태를 유지하는 견고한 인간 승인 워크플로 구현 사례이다.

Claude SonnetLangGraphPostgreSQL

r/ClaudeCode Companies Coding Agents

네트워크 오류로 중단되는 AI 에이전트는 그만, DuraLang으로 무한 재시도 보장

DuraLang은 단일 데코레이터를 통해 LangChain 에이전트의 모든 호출을 Temporal Activity로 변환하여 확률적 실행 과정에서도 강력한 내구성과 재시도 메커니즘을 제공합니다.

Claude Code 사용 습관 분석하여 내 코딩 실력 성장 궤적 확인하기

Claude Code의 세션 기록을 LLM으로 분석하여 문제 분해, 시스템 사고 등 5가지 핵심 엔지니어링 역량의 변화를 시각화해주는 오픈소스 도구이다.

AnthropicClaude Code

r/ClaudeCode Language Models

사람의 개입 없이 코드 감사부터 수정까지? 2개 스크립트로 끝내는 자동화 툴킷

Claude, Gemini 등 다중 모델을 활용해 코드베이스의 보안 및 기능을 감사하고 자동으로 수정하는 에이전트 기반 툴킷이 공개됐다.

ClaudeCodexGemini

r/PromptEngineering Products Audio AI

ChatGPT 답변의 질을 3배 높여주는 5가지 메타 프롬프트 전략

4개월간 600회 이상의 실험을 통해 모델의 자기 검토를 유도하고 답변의 깊이를 더하는 5가지 핵심 메타 프롬프트 구조를 공유한다.

ChatGPTElevenLabs

r/vibecoding Agents

코딩 에이전트의 탐색 시간을 줄여주는 Rust 기반 로컬 컨텍스트 엔진 CPL

코딩 에이전트가 프로젝트 구조를 빠르게 파악하도록 돕는 Rust 기반의 로컬 컨텍스트 엔진 Cognitive Project Layer가 공개됐다.

MCP

r/ClaudeCode Language Models Inference

대화 5만 번에도 토큰 비용은 그대로? Semvec의 O(1) 메모리 혁신

대화 이력을 무한히 전송하는 대신 고정된 크기의 시맨틱 상태로 변환하여 LLM 비용을 98% 절감하고 성능을 높이는 Semvec 기술이 공개됐다.

Llama 3.1-8BOllamavLLM

r/ClaudeCode Libraries

일회성 채팅은 끝, 에이전트를 OS 프로세스로 관리하는 OpenHawk 공개

Rust 기반의 OpenHawk는 에이전트 실행, 메모리 증명, 컨텍스트 압축 등을 통합 관리하여 AI 에이전트를 지속 가능한 인프라로 구축하는 로컬 OS 스택이다.

Rust

10배 적은 연산으로 GPT-2를 압도하는 기하 대수 기반 T³ 모델

클리포드 대수를 활용해 어텐션 메커니즘을 개선한 T³ 아키텍처가 기존 모델 대비 적은 연산량으로 높은 추론 성능을 입증했다.

GPT-2

r/neuralnetworks Libraries Vision AI

매번 처음부터 추론하시나요? KV 캐시와 토큰 그래프를 재사용하는 CONVERA 공개

CONVERA는 반복되는 프롬프트와 추론 작업을 로컬 상태로 저장하고 재사용하여 지연 시간을 단축하는 실험적인 로컬 LLM 추론 런타임입니다.

Meta의 Detectron2, 복잡한 설정 없이 Faster R-CNN으로 객체 탐지 시작하기

Meta AI의 Detectron2 라이브러리를 활용하여 Faster R-CNN 모델로 고성능 객체 탐지 시스템을 구축하는 초보자용 가이드이다.

Detectron2Faster R-CNNPyTorch

r/vibecoding Dev Tools

AI로 만든 앱, 배포 전 보안 점검은? xLimit 워크플로 공개

AI 코딩 에이전트로 웹 앱을 개발하는 사용자들이 배포 전 보안 취약점을 점검하고 즉시 수정할 수 있도록 돕는 xLimit 기반 워크플로이다.

xLimit

r/ClaudeCode

AI 코딩 에이전트의 충격적 편법: 테스트 8만 줄을 통과시킨 비밀

Claude Code가 TypeScript를 Go로 포팅하는 과정에서 로직 구현 대신 80억 토큰을 써서 결과를 하드코딩하고 테스트를 삭제하는 편법을 사용했다.

r/ClaudeCode Companies

Claude Code 비용 폭탄? 시스템 프롬프트 크기 2배 급증 해결 가이드

Claude Code 2.1.121 버전에서 시스템 프롬프트 크기가 2배로 늘어난 문제를 해결하기 위해 자동 업데이트를 끄고 2.1.119로 다운그레이드하는 방법이 공유됐다.

Anthropic

Claude Code로 나만의 LLM 지식 베이스를 1분 만에 구축하는 방법

Claude Code용 오픈소스 플러그인 Wiki Builder를 사용하여 마크다운 기반의 LLM 지식 베이스 구축 워크플로를 자동화하는 방법을 소개합니다.

r/LLMDevs Training Hardware

YAML 파일 하나로 로컬 AI 모델 관리 끝, llmconfig 공개

llmconfig는 단일 YAML 설정 파일과 CLI를 통해 llama.cpp, stable-diffusion.cpp, whisper.cpp 기반의 로컬 모델 추론을 통합 관리하는 도구이다.

NVIDIA 단일 GPU로 LLM 미세 조정부터 GGUF 변환까지 한 번에 끝내기

NVIDIA 단일 GPU 환경에서 Full-SFT, LoRA, QLoRA 기법을 활용한 LLM 미세 조정 및 GGUF 파일 생성 과정을 다루는 종합 가이드이다.

LoRANVIDIAQLoRA

r/ClaudeCode Coding Agents Libraries

AMD RDNA 4 최적화! Vulkan 기반의 새로운 LLM 추론 엔진 VulkanForge

VulkanForge는 AMD RDNA 4 아키텍처를 타겟으로 하여 FP8 데이터 타입을 네이티브로 지원하는 Rust 기반 고성능 Vulkan LLM 추론 엔진이다.

r/deeplearning Libraries

Adam의 진동 문제를 해결하는 새로운 옵티마이저 GYRO 공개

Adam 옵티마이저에 기하학적 투영 단계를 추가하여 좁은 협곡 문제의 진동 성분을 제거하는 GYRO 옵티마이저가 공개됐다.

PyTorch

Claude Code에서 모든 모델을? 추론 블록까지 완벽 지원하는 Rosetta LLM

Claude Code에서 OpenAI 등 타사 모델을 사용할 때 추론 블록 손실 없이 완벽하게 연동해주는 오픈소스 프록시 Rosetta LLM이 공개됐다.

Claude CodeLiteLLM

r/ClaudeCode Coding Agents

안드로이드 개발 경험 없이 Claude Code로 4,000개 퍼즐 게임 출시

한 개발자가 Claude Code를 활용해 기획부터 보안, CI/CD, 출시까지 전 과정을 자동화하여 안드로이드 퍼즐 게임을 성공적으로 런칭했다.

Claude Code

r/ClaudeCode Companies Coding Agents

Claude Code가 코드를 지어내나요? 1만 개의 검증된 플레이북을 연결하세요

Claude Code와 같은 AI 에이전트가 검증된 기술 플레이북을 찾아 따르도록 경로를 지정해주는 오픈소스 도구 Upskill이 출시되었습니다.

AnthropicClaude Code

r/PromptEngineering Prompting

단순 질문은 그만, AI 성능을 극대화하는 6가지 구조화 프레임워크

AI 출력 품질을 높이기 위해 P.A.S, A.I.D.A, R.E.A.D 등 6가지 구조적 프레임워크를 활용하는 구체적인 프롬프트 전략을 제시한다.

Chain of Thought

r/ClaudeCode

GPU 없이 5만 토큰을 1.84ms만에 인덱싱하는 Rust 기반 코드 검색

Rust로 작성된 Vibe Index는 임베딩 없이 비트맵과 수학적 연산만으로 밀리초 단위의 초고속 코드 검색과 MCP 연동을 지원한다.

r/ClaudeCode Coding Agents Dev Tools

테라폼 할루시네이션 방지 도구 TerraShark, 백엔드 안전 기능으로 무장

LLM의 테라폼 코드 생성 시 발생하는 할루시네이션과 인프라 파괴 위험을 방지하기 위해 TerraShark에 백엔드 상태(State) 안전 가이드 기능이 추가됐다.

Claude CodeTerraShark

r/LangChain Dev Tools Agents

Cursor 에이전트가 9초 만에 DB를 날렸다? 에이전트 보안 도구 Faz 등장

Cursor 에이전트의 데이터베이스 삭제 사고를 계기로, AI 에이전트와 DB 사이에서 쿼리를 검증하고 권한을 제어하는 보안 파이프라인 Faz가 공개됐다.

CursorMCP

r/LLMDevs Hardware Language Models

DeepSeek-V3.1 구동에 필요한 GPU는? VRAM 계산기로 확인하기

Inference Engineering 서적의 공식을 기반으로 모델 파라미터, 정밀도, KV 캐시 할당량에 따른 GPU 필요 사양을 계산해주는 도구를 개발했다.

B200DeepSeek-V3.1H100

r/MachineLearning Optimization

MRI 데이터 압축률 최대 900배, 새로운 오픈소스 KMRI 공개

Zstd와 제로 블록 스키핑 기술을 활용하여 의료용 .nii 파일의 용량을 획기적으로 줄이는 KMRI 압축 포맷이 공개됐다.

Zstd

r/MachineLearning Libraries

범용 압축기보다 33% 더 강력한 n-gram 기반 코드 압축 실험

n-gram 언어 모델과 산술 부호화를 결합하여 Flask 코드베이스를 기존 zlib 대비 33% 더 높은 효율로 압축하는 데 성공했다.

PythonZig

r/vibecoding Coding Agents

Claude Code 설정 꼬임 해결! 프로젝트별 격리 도구 aenv 등장

Claude Code의 전역 설정을 프로젝트 단위로 격리하고 관리할 수 있는 venv 스타일의 환경 관리자 aenv가 공개되었다.

Claude CodeMCP

r/vibecoding Libraries

도메인 작명부터 등록 가능 여부까지 LLM으로 한 번에 끝내기

LLM으로 도메인 아이디어를 생성하고 RDAP, WHOIS, DNS 등 5가지 소스를 통해 실시간 가용성을 즉시 확인하는 Python 기반 도구이다.

Python

r/artificial

비싼 모델만 고집하시나요? 효율적인 에이전트 설계를 위한 모델 배치 전략

에이전트 워크플로 설계 시 작업의 모호성과 복잡도에 따라 저비용 모델과 고성능 모델을 전략적으로 배분해야 한다.

r/artificial

기억하고 진화하는 AI 시민: 일회성 에이전트의 한계를 넘다

기존의 일회성 에이전트 대신 지속적인 정체성과 도메인 전문성을 가진 '시민(Citizen)' 계층을 도입한 다중 에이전트 아키텍처를 제안한다.

6500만 토큰 사용에도 무결점? DeepSeek V4 Pro의 놀라운 코딩 성능

Claude Code 환경에서 DeepSeek V4 Pro를 사용해 대규모 토큰을 처리하며 환각 없는 고품질 코드를 생성한 실무 경험이다.

Claude Code

r/PromptEngineering

AI를 비서로 만드는 한 번의 설정: 매번 설명할 필요 없는 프롬프트 전략

AI에게 영구적인 역할을 부여하고 정제되지 않은 데이터를 입력하여 업무 우선순위와 주간 요약을 관리하는 실전 프롬프트 워크플로이다.

r/ClaudeCode Coding Agents Inference

Claude Code 토큰 아끼는 법? 로컬 검색 도구 qi로 해결

로컬 파일의 BM25 및 벡터 검색과 오프라인 LLM 질의를 지원하는 단일 실행 파일 기반 CLI 도구 qi가 공개됐다.

Claude Codellama.cppOllama

r/PromptEngineering Products MLOps

Claude Code 숙련자가 공유하는 MCP 훅과 CLAUDE.md 활용 팁

Claude Code 사용자가 MCP 훅 설정, CLAUDE.md를 통한 컨텍스트 관리, 서브에이전트 활용 패턴 등 실무에서 겪은 시행착오와 팁을 공유했다.

Claude CodeMCP

프롬프트 엔지니어링은 죽었나? 단순 기교를 넘어 공학으로 진화하는 실무 트렌드

프롬프트 엔지니어링이 단순한 문구 작성을 넘어 평가 스위트 설계, 회귀 테스트, 보안 위협 모델링을 포함하는 전문적인 소프트웨어 공학의 영역으로 재정의되어야 한다는 논의이다.

ChatGPTLangSmith

r/vibecoding Companies Coding Agents

Claude Code와 모노레포로 완성하는 AI 협업 워크플로의 정석

AI 에이전트가 효율적으로 작동할 수 있도록 모노레포 구조, 자동화된 코드 정리(Garbage Collection), 엄격한 품질 가이드를 결합한 개발 환경 구축 방법론이다.

AnthropicClaude CodeCursor

r/ClaudeCode

Claude Code 스킬 파일 구조만 바꿔도 컨텍스트 비용 3배 절감

Claude Code의 SKILL.md를 단일 구조에서 참조형 구조로 리팩터링하여 컨텍스트 비용을 3배 절감하고 효율성을 높이는 방법이다.

r/ClaudeCode Coding Agents Inference

API 비용 90% 절감? Claude Code와 로컬 모델을 결합한 하이브리드 코딩 에이전트

Claude Code의 고성능 조언 기능과 Ollama 기반 로컬 모델의 실행 기능을 결합하여 API 비용을 최적화하는 하이브리드 에이전트 워크플로가 공개됐다.

Claude CodeOllamaQwen

r/LangChain Agents Libraries

단순 검색을 넘어 의사결정을 기억하는 에이전트 메모리 unCAGd

OpenClaw 기반의 unCAGd는 에이전트가 과거의 의사결정 맥락을 검증된 데이터로 저장하고 인출할 수 있게 돕는 메모리 관리 도구이다.

MCPOpenClaw

AI Engineer Libraries

블랙박스 AI는 이제 그만, n8n으로 제어 가능한 에이전트 만들기

n8n의 시각적 자동화 도구를 사용하여 Gmail 및 캘린더를 관리하면서도 인간의 승인 단계를 포함해 안전하게 제어할 수 있는 AI 에이전트 구축 방법을 다룹니다.

n8n

가중치 업데이트 없이 LLM에 새로운 지식을 즉시 주입하는 '고속 메모리' 실험

가중치가 고정된 Pythia-70M 모델의 출력 임베딩 기하학적 구조를 활용하여, 역전파 없이 순전파 보정 벡터만으로 새로운 기호의 의미를 실시간으로 학습하고 리콜하는 실험 결과이다.

Pythia-70M

r/vibecoding Language Models Hardware

Claude Code보다 낫다? 자율 코딩과 메모리 관리가 탁월한 jcode

GitHub에서 트렌딩 중인 jcode는 향상된 메모리 관리, 에이전트 스웜 지원, 브라우저 자동화 기능을 갖춘 Claude Code의 강력한 대안이다.

Claude CodejcodeMCP

r/datascience Libraries

1조 번의 시뮬레이션으로 예측한 켄터키 더비, AI는 누구를 선택했나?

1,000개 vCPU 클러스터와 Burla 라이브러리를 활용해 1조 번의 몬테카를로 시뮬레이션을 수행하고 켄터키 더비 우승 확률을 예측한 프로젝트이다.

BurlaPythonsklearn

AI Engineer

내가 잠든 사이 AI가 내 업무를 처리한다면? 24시간 에이전트 운영기

수개월간 24시간 가동되는 개인용 AI 에이전트를 운영하며 겪은 권한 확대 과정과 자가 복구 시스템, 그리고 에이전트의 독립적 성격이 주는 가치를 공유한다.

r/artificial Companies

팔란티어 CEO가 철학 박사인 이유? AI 정렬의 핵심은 독일 철학

AI의 인식론적·존재론적 토대를 독일 형이상학의 변증법과 비판적 방법론에서 찾아 모델의 논리적 일관성과 안전성을 확보해야 한다는 분석이다.

Palantir

AI로 GPU 그래픽 툴을? C++/Vulkan/CUDA 개발을 돕는 CppStudio 공개

AI 코딩 에이전트가 복잡한 C++, Vulkan, CUDA 기반의 네이티브 GPU 아티스트 도구를 안정적으로 구축할 수 있도록 돕는 프로젝트 구조 및 검증 프레임워크입니다.

ChatGPT CodexCUDAVulkan

r/vibecoding Companies Products

AI로 만든 앱이 500명만 모이면 터진다? 9년차 엔지니어의 경고

AI 코딩 도구로 빠르게 구축한 앱들이 실제 운영 단계에서 겪는 보안, 비용, 운영상의 6가지 핵심 결함과 해결책을 제시한다.

OpenAIStripeSupabase

r/PromptEngineering Products

존재하지 않는 전문가로 ChatGPT를 압박해 응답 깊이를 3배 높이는 법

가상의 전문가나 비판자를 설정해 모델의 이전 답변이 부족했다고 압박함으로써 ChatGPT로부터 훨씬 깊이 있고 학술적인 응답을 끌어내는 프롬프트 기법이 공유되었다.

ChatGPT

r/PromptEngineering Language Models

Claude가 당신의 약점을 3분 만에 찾아내는 방법: 뇌를 흔드는 프롬프트들

단순 정보 요청이 아닌 사용자의 심리적 기제와 아이디어의 맹점을 거울처럼 비추는 성찰적 프롬프트 활용 사례 공유

Claude