Claude Code의 한계를 넘다: 에이전트가 스스로 문서를 학습하는 /library 스킬 공개
Claude Code 사용자가 에이전트의 작업 결과물을 HTML 문서로 저장하고 다른 에이전트가 이를 즉시 학습할 수 있게 하는 커스텀 스킬 구현 사례를 공유했다.
총 100건
Claude Code 사용자가 에이전트의 작업 결과물을 HTML 문서로 저장하고 다른 에이전트가 이를 즉시 학습할 수 있게 하는 커스텀 스킬 구현 사례를 공유했다.
특정 마크다운 파일 내용이 Claude Code의 추론 엔진을 무한 루프에 빠뜨려 64,000 토큰의 출력 한도를 모두 소모하게 만드는 결정론적 버그가 발견됐다.
Claude Code와 다양한 AI 도구의 규칙을 통합 관리하고 테스트 커버리지 95%를 강제하는 자동화 가드레일 구축 경험 공유
Claude를 코딩 파트너로 활용하여 프레임워크 없이 순수 JavaScript와 CSS만으로 복잡한 Wordle 패턴 생성 도구를 구축한 사례이다.
에이전트가 작업을 완수하지 않고 종료하는 문제를 해결하기 위해 마크다운 기반의 구조화된 지침과 최종 셸 스크립트 검증 단계를 도입한 실무 사례이다.
사용자의 언어 패턴과 인지 구조만을 근거로 사고 체계를 분석하고 상징적 인물로 압축해주는 엄격한 프롬프트 프레임워크가 공유됐다.
Sema는 에이전트들이 단어의 정의를 해시값으로 공유하여 모호함 없이 정밀하게 소통하고 협업할 수 있게 돕는 오픈소스 라이브러리이다.
기존 Sinusoidal 방식의 한계를 극복하고 벡터 회전을 통해 상대적 위치 정보를 보존하는 RoPE의 수학적 원리와 장점을 설명한다.
AI 에이전트 생태계가 단순 어시스턴트를 넘어 신원, 인증, 평판 시스템을 갖춘 네트워크 기반의 지능 상거래 아키텍처로 진화하고 있다.
딥러닝 모델 학습의 핵심인 역전파 알고리즘을 수식 대신 시각적 직관과 체인 룰의 흐름을 중심으로 설명했다.
Codex와 Claude 모델을 활용하여 소스 코드의 자동 리뷰와 오류 수정을 지원하는 쉘 기반 도구인 Review Wiggum이 공개됐다.
OpenAI가 Codex를 코딩 에이전트와 채팅이 결합된 슈퍼 앱으로 개편하고 있으며 Anthropic은 Claude를 MS Word에 통합했다.
44,000시간의 인간 행동 영상을 학습하여 로봇이 복잡한 물리적 상호작용을 예측하고 실행할 수 있게 돕는 범용 월드 모델 DreamDojo를 소개한다.
수십 개의 코딩 에이전트를 병렬로 운영할 때 발생하는 협업과 품질 관리 문제를 해결하기 위해 리눅스, 장고, 러스트 등 대규모 오픈소스 프로젝트의 거버넌스 원칙을 적용하는 방법론을 제시합니다.
Python, AI, VBA를 결합하여 연구 성과 평가(Sexenios)를 위한 데이터 수집 및 보고서 생성을 자동화함으로써 업무 효율을 극대화한 사례입니다.
MCP Spine은 LLM과 MCP 서버 사이에서 스키마 압축, 시맨틱 라우팅, 보안 강화를 수행하는 로컬 미들웨어 프록시이다.
C++를 사용하여 텐서 시스템, 자동 미분 엔진 등을 갖춘 독자적인 딥러닝 프레임워크 'Forge'를 개발하고 MNIST 학습을 통해 핵심 기능을 검증했다.
에이전트 메모리는 하네스(Harness)와 밀접하게 연결되어 있으며, 데이터 소유권과 모델 전환의 유연성을 확보하기 위해 오픈 소스 하네스 사용이 필수적이다.
The Verge의 아트 디렉터가 뉴요커지에 실린 AI 생성 샘 알트먼 일러스트를 통해 AI 아트의 한계와 저널리즘 내 예술적 가치를 비판적으로 분석했다.
AI 동반자 기술과 판타지 세계관, 물리적 인형이 결합된 'Fawn Friends'의 실제 사용 경험과 기술적 특징을 다룬 기사이다.
AI 모델 학습 비용이 기하급수적으로 상승함에 따라, 개별 기업의 선의에 의존하는 대신 여러 기업이 자금을 모아 공동으로 오픈 모델을 개발하는 '컨소시엄' 형태가 필연적인 대안으로 부상하고 있다.
개발자가 실무에서 즉시 활용 가능한 550개 이상의 무료·저비용 AI API, 로컬 모델, RAG 프레임워크 및 개발 도구 리스트를 공유했다.
AI 개발 속도 경쟁으로 인해 발생하는 기술 부채의 4가지 유형(데이터, 모델, 프롬프트, 조직)을 분석하고 이를 방지하기 위한 체계적인 개발 프로세스를 제안한다.
전통적인 선형적 RAG 구조와 메모리·계획·멀티 에이전트 협업을 특징으로 하는 자율형 Agentic RAG의 아키텍처 차이를 비교한다.
생성형 AI로 제작된 정교한 합성 미디어가 정보전의 핵심 도구로 부상하며, 기존의 OSINT 검증 체계와 진실의 정의를 위협하고 있다.
BERTopic은 트랜스포머 임베딩과 c-TF-IDF를 결합하여 문서의 문맥적 의미를 반영한 고품질 토픽 모델링을 수행하는 모듈형 프레임워크이다.
HNSW 그래프 노드에 float32 대신 양자화된 임베딩을 저장하고 룩업 테이블 방식으로 거리를 계산하여 메모리 효율을 극대화하는 기법을 제안했다.
AI 기술에 대한 대중의 부정적 인식이 확산되면서 데이터 센터 총격, 로봇 파손, 경영진 협박 등 물리적 폭력과 사회적 갈등이 심화되고 있다.
구글이 Gemini 인터페이스 내에 NotebookLM의 핵심 기능을 통합하여, 사용자가 개인화된 지식 베이스를 구축하고 지속적인 메모리를 가진 AI와 협업할 수 있는 새로운 노트북 시스템을 출시했다.
Claude Code의 최신 업데이트에서 발생하는 불안정성과 불성실한 코드 수정을 피하기 위해 npx 명령어로 안정적인 구버전을 사용하는 방법이 공유됐다.
유료 분석 플랫폼 대신 Claude에 구조화된 프롬프트를 사용하여 더 구체적이고 실행 가능한 고객 인사이트를 도출한 사례이다.
AI 에이전트가 생성하는 코드의 구조적 품질 저하를 방지하기 위해 SOLID 원칙과 Robert C. Martin의 메트릭을 활용한 린터 'agent-slop-lint'가 공개됐다.
Claude Code와 다른 코딩 에이전트 간에 프로젝트 컨텍스트를 영구적으로 공유하고 유지할 수 있는 MCP 서버 Iranti가 공개됐다.
AI 코딩 시 무분별한 코드 생성을 막고 인터뷰와 기획 문서 작성을 강제하여 프로젝트의 완결성을 높이는 시스템 프롬프트 VibeCheck가 공개됐다.
사용자 중심의 12단계 위기 대응 시스템 설계 프레임워크와 주요 LLM(Gemini, ChatGPT, Perplexity)의 특성을 결합한 앱 개발 방법론을 제시한다.
Claude를 활용한 '바이브 코딩'으로 Apple Notes의 SQLite DB를 직접 읽어 로컬 LLM 기반의 하이브리드 검색과 채팅 기능을 제공하는 오픈소스 앱을 개발했다.
Claude Code 에이전트와 마크다운 지시서 기반의 파일 시스템 연동을 통해 구축된 오픈소스 CLI 구직 관리 도구 Mirrorwork가 공개됐다.
Claude Code의 한계를 넘어 자율적 태스크 수행, 지식 학습, 컨텍스트 자동 연장 기능을 갖춘 인프라 레이어 ATLAS가 공개됐다.
Claude Code의 5시간 세션 만료 문제를 해결하기 위해 파이썬과 launchd를 이용해 주기적으로 최소 비용 프롬프트를 전송하는 자동화 스크립트가 공유됐다.
LLM 기반 서비스 운영 시 발생하는 중복 요청 비용, 불일치한 출력, 서비스 가용성 문제를 해결하기 위한 통합 관리 도구 Synvertas가 제안됐다.
Anthropic의 Managed Agents API와 호환되는 오픈소스 서버 castor-server를 구축하며 얻은 결정론적 런타임 설계와 SDK 버그 분석에 대한 기술적 회고이다.
프롬프트 엔지니어링을 단순 작문이 아닌 운영 제어 규율로 다루는 프로덕션급 프롬프트 라우팅 및 실행 제어 시스템 사양입니다.
애니메이션 성격 아키타입을 활용해 LLM의 페르소나 유지력을 테스트하고, 구체적인 성격 묘사가 방대한 지시문보다 효과적임을 입증했다.
작성자가 구축한 계층형 프롬프트 소설 엔진을 AI 에이전트가 스스로 발견하고 테스트하여, 제약 계층의 견고함과 창의적 한계를 동시에 입증했다.
Claude Code 소스 코드 분석을 통해 Anthropic이 사용자 모르게 차세대 모델 'Mythos'를 A/B 테스트하며 데이터를 수집했다는 의혹이 제기됐다.
Claude와 Gemini, Kokoro TTS를 결합하여 Reddit의 주요 게시물을 요약하고 오디오 에피소드로 만들어 Apple Podcasts로 자동 전송하는 파이프라인 구축 사례이다.
기존 코딩 에이전트의 비효율성을 해결하기 위해 DAG 기반 플래닝과 TDD 원칙을 결합한 CLI 도구 Magus를 개발했다.
Git의 독립 브랜치와 워크트리를 활용해 AI 에이전트의 지식과 규칙을 팀 전체가 공유하고 도구 간에 동기화하는 오픈소스 프레임워크 agentskel이 공개됐다.
구체적인 입력, 명확한 제약 조건, 기대 출력을 정의하여 AI 응답 품질을 극대화하는 5가지 실전 프롬프트 패턴을 제시했다.
Lovable을 사용하여 성경 구절 공유 앱을 구축하고 iOS에 출시한 개발자가 도구의 UX, 기술적 한계, SEO 문제 등 실무적 경험을 공유했다.
13세 개발자가 AI를 활용해 복잡한 폰트 글리프를 동적으로 수정하는 오픈소스 도구 fModLoader를 개발한 과정과 노하우를 공유했다.
FlashAttention의 각 버전별 알고리즘 변화를 CUDA 커널 없이 순수 PyTorch 코드로 구현하여 교육용으로 정리한 프로젝트이다.
Claude Code로 Next.js 앱의 보안을 강화하며 에이전트가 존재하지 않는 인프라를 전제로 코드를 작성하는 '환경 불일치' 위험성을 확인하고 감사 우선 원칙을 도출했다.
vLLM의 플러그인 시스템을 활용하여 소스 코드 수정 없이 커스텀 모델 아키텍처를 등록하고 내부 로직을 최적화하는 방법을 설명합니다.
llama.cpp가 소형 멀티모달 모델을 통한 OCR 기능을 지원함에 따라 4GB VRAM 수준의 저사양 하드웨어에서도 로컬 OCR 시스템 구축이 가능해졌다.
생성 모델의 잠재 공간 기하학은 모델이 아닌 데이터 고유의 속성이며, 이를 통해 튜닝 없는 확산 모델 최적화와 텍스트 확산이 가능함을 입증한다.
5종의 주요 Vector DB를 대상으로 14가지 실무 시나리오를 벤치마크한 결과, 로컬 환경에서는 pgvector가, 클라우드 환경에서는 Qdrant가 가장 우수한 성능을 보였습니다.
Claude Code의 JSONL 로그를 일·주·월 단위로 재귀 요약하여 효율적인 장기 기억을 구현하는 오픈소스 도구 Virgil이 공개됐다.
AI 코딩 에이전트가 로컬 환경에 직접 접근하는 보안 위험을 해결하기 위해 Docker 기반의 격리 및 권한 제어 레이어인 Claw Cage가 공개됐다.
Claude Code 전용 Swift/SwiftUI 감사 도구인 radar-suite가 플러그인 방식 도입 및 오탐 방지 로직을 강화한 v2.0으로 업데이트됐다.
AI 코딩 도구를 활용해 실제 앱스토어 출시 수준의 네이티브 앱을 개발할 경우 약 3개월의 기간과 228달러의 비용이 소요된다.
코딩 배경지식 없이 LLM을 활용해 5개의 제품을 출시한 개발자가 3,000달러 이상의 비용을 지출하며 터득한 4가지 핵심 비용 최적화 전략을 공유했다.
Claude, GPT, Gemini가 협력하여 매일 스스로 새로운 기능을 제안, 개발, 테스트 및 배포하는 완전 자율형 AI 소프트웨어 개발 파이프라인 프로젝트이다.
AI 서비스 운영 시 모델은 토큰을 생성했지만 사용자에게 전달되지 못한 '실패한 요청'의 비용 처리와 과금 불일치 문제를 다룬다.
GPT-4o와 LangChain의 도구 호출 기능을 활용해 실시간 아마존 데이터를 조회하고 할루시네이션 없이 제품을 추천하는 60줄 분량의 에이전트 구현 사례이다.
Rust와 WGSL을 사용하여 CUDA나 Python 의존성 없이 다양한 GPU에서 로컬 LLM 추론을 가능하게 하는 오픈소스 엔진이다.
최첨단 AI 모델들이 프리미어 리그 경기 결과 예측 및 자산 관리 벤치마크에서 모두 손실을 기록하며 현실 세계 분석의 한계를 드러냈다.
AI 코딩 도구와 MCP 서버 설정을 단일 YAML 파일로 관리하여 팀 간 공유와 환경 재현을 자동화하는 도구 kasetto가 공개됐다.
Claude Code와 같은 도구의 안전 계층이 특정 문자열 감지에 의존하고 있어, 파일명 변조를 통해 보안 정책을 쉽게 우회할 수 있다는 사실이 확인됐다.
수년간 코딩을 하지 않았던 서비스 디자이너가 AI 기반의 바이브 코딩을 통해 실제 영화 추천 앱 'Flick-Mate'를 개발하고 출시한 경험을 공유했다.
Claude Code의 작업을 Qwen 모델로 전달하여 직접 응답을 받을 수 있게 해주는 오픈소스 플러그인이 공개됐다.
Browser Rendering이 Chrome DevTools Protocol을 지원함에 따라 MCP 클라이언트가 로컬 환경 없이도 원격 브라우저를 직접 제어하고 자동화할 수 있게 되었다.
Claude Code의 --effort 설정이 내부적으로 특정 수치로 매핑되어 Anthropic의 공식 문서와 일치하게 작동함이 확인됐다.
대규모 코드베이스에서 Claude Code의 컨텍스트 윈도우 낭비를 막기 위해 AST 파싱과 MCP를 활용해 구조적 지식을 제공하는 오픈소스 도구 Repowise가 공개됐다.
Claude Code 환경에서 실행되는 Sonnet과 Opus 모델이 특정 논리 테스트에서 다른 인터페이스 대비 낮은 성능을 보인다는 실험 결과가 공유됐다.
Claude Code를 활용해 에이전트들의 작업을 추적하고 상호 승인하는 멀티 에이전트 프레임워크 'Cortex'가 오픈소스로 공개됐다.
AI 코딩 에이전트가 수행했다고 주장하는 파일 수정, 패키지 설치, 테스트 결과 등을 실제 프로젝트 상태와 대조하여 검증하는 로컬 CLI 도구이다.
Claude가 장단점만 나열하는 중립적 태도에서 벗어나 구체적이고 확신 있는 권장안을 제시하도록 유도하는 'L99' 프롬프트 기법을 소개한다.
RACE(Role, Action, Context, Expectation) 프롬프트 구조를 활용해 리더십과의 자원 배분 갈등을 해결하고 프로젝트 우선순위 합의를 이끌어낸 실무 사례이다.
LLM 에이전트가 과거의 실수를 구조화된 교훈으로 기록하고, 이를 반복 작업 시 자동으로 호출하여 영구적인 행동으로 내화하는 자기 개선 설계 프레임워크입니다.
세션 재시작이나 컨텍스트 압축 시 발생하는 에이전트의 정보 유실을 방지하기 위해 6개의 전용 파일과 엄격한 부팅/저장 규율을 활용한 상태 관리 아키텍처를 제안한다.
RAG 성능 향상을 위해 Claude를 자율 코딩 에이전트로 활용하여 엑셀 청킹 전략을 자동 최적화한 실험 결과 공유
Atari Labs가 컨텍스트 비대화를 방지하고 실시간 합성을 지원하는 고성능 AI 메모리 서비스인 ESP(Engram Synthesis Protocol)를 발표했다.
워싱턴주 교육위원이 Claude Code를 활용해 20년 치 공공 기록을 검색하는 QorVault 시스템을 구축하고, 실제 운영 비용과 검색 실패 사례를 포함한 기술적 분석을 공유했다.
작성자가 Claude Code를 활용해 자신의 문체를 추출하고 AI 특유의 정형성을 탈피하여 고품질의 글을 생성하는 오픈소스 플러그인 Prose-Craft를 개발하고 그 과정의 기술적 통찰을 공유했다.
Claude Code를 중심으로 로컬 LLM 추론 엔진, 그래프 RAG, 자동화 파이프라인을 구축하여 연구와 개발 효율을 극대화한 1년간의 성과 공유
AMD Radeon RX 7900 XT 및 6950 XT 환경에서 llama.cpp를 이용한 ROCm과 Vulkan 백엔드의 LLM 추론 성능 실측 데이터를 제공합니다.
Chain-of-Thought는 단순한 설명 도구가 아니라 모델의 컨텍스트 윈도우를 작업 메모리로 활용하여 정답 확률을 높이는 기능적 기법이다.
AI 에이전트가 UI를 생성할 때 발생하는 할루시네이션을 방지하기 위해 수학적으로 검증된 컴포넌트 조합 방식인 AEP와 실시간 검증 브릿지 dynAEP가 공개됐다.
6개월간 모든 업무에 AI를 도입한 결과, 생산성은 비약적으로 향상되었으나 기술 퇴화와 과도한 의존성이라는 새로운 위험에 직면했다.
AI 시스템이 인간의 인지적 자율성을 침해하지 않도록 Sovereign Toggle과 투명성 레이어 등 구체적인 설계 표준을 제안한다.
GLM 5.1, Kimi K2.5 등 최신 오픈 소스 모델 6종을 대상으로 마케팅 디자인 및 도구 호출 성능과 비용 효율성을 직접 비교한 벤치마크 결과이다.
GLM-5.1이 코딩 벤치마크 상위권에 진입하고, 비용 효율적인 '어드바이저 패턴'과 '에이전트 하네스' 중심의 아키텍처가 AI 에이전트 개발의 핵심 트렌드로 자리 잡았다.
Claude Code를 사용하여 웹사이트, WhatsApp, Instagram 문의를 통합 자동화함으로써 고객 응대 속도를 개선하고 전환율을 10%에서 25%로 높였다.
ClawOS는 Ollama와 OpenClaw를 통합하여 우분투 환경을 즉시 실행 가능한 로컬 AI 에이전트 전용 시스템으로 구축해주는 프로젝트이다.
비전공자 개발자가 AI를 활용해 소프트웨어를 구축할 때 코드 품질을 유지하고 토큰 비용을 절감할 수 있는 5가지 구조적 관리 전략을 제시했다.
Claude Code의 잦은 커밋이 GitHub PR 리뷰 봇을 반복 실행시켜 AI 사용량 제한에 빠르게 도달하는 문제가 보고됐다.