Claude Code의 맥락 유지와 아키텍처 일관성을 자동화하는 DevArch
Claude Code의 세션 간 맥락 유지와 아키텍처 일관성 문제를 해결하기 위해 엔지니어링 규율을 자동화하는 플러그인 DevArch.
총 100건
Claude Code의 세션 간 맥락 유지와 아키텍처 일관성 문제를 해결하기 위해 엔지니어링 규율을 자동화하는 플러그인 DevArch.
TTRPG 캠페인 관리를 위한 MCP 설정을 자동화하는 데스크톱 앱 Nexus가 공개되었다.
30B급 로컬 모델에서 실행되며 Spec Driven Development를 통해 스스로 코드를 설계, 계획, 검증하는 자가 개선형 코딩 에이전트 SPINE을 소개한다.
Rust로 작성된 LLM 압축 도구 CHSE는 초당 115만 라인을 처리하며 토큰 사용량을 69~91%까지 줄여 효율성을 극대화한다.
Clojure 매크로와 LLM을 결합하여 프로그램 실행 중 로직이 동적으로 진화하는 시스템을 구현한 기술 블로그.
Alphabet이 AI 인프라 확장을 위해 800억 달러 규모의 주식 발행을 통한 자금 조달 계획을 발표했다.
3D 생성 모델은 최종 결과물이 아닌 창작 과정의 시작점으로, Figma, Tripo AI, Blender를 연결하는 워크플로우가 효율적이다.
Anthropic의 IPO 준비, 마이크로소프트와 엔비디아의 신규 모델 공개 등 AI 업계의 주요 뉴스를 정리합니다.
LLM 에이전트와 도구 사이에 위치하여 무한 루프, 예산 초과, 권한 오남용을 감지하고 차단하는 오픈소스 SDK 'AgentBrake'를 개발했다.
기존 AI IQ 측정 방식의 한계를 지적하고, 5개 차원을 통합하여 모델 성능을 평가하는 새로운 벤치마크 방법론을 소개한다.
Amazon Bedrock이 OpenAI의 GPT-5.5, GPT-5.4 모델과 코딩 에이전트 Codex를 정식 출시하여 엔터프라이즈급 보안 환경에서 활용 가능해졌다.
Amazon Quick Research는 다중 소스 데이터를 통합하고 LLM 기반으로 합성하여 근거 중심의 연구 보고서를 자동 생성하는 에이전트형 연구 워크플로를 제공한다.
5월 AI 업계는 좌석 기반 비즈니스 모델에서 토큰 기반으로 전환되며, 전례 없는 AI 인프라 수요와 토큰 부족 현상을 겪었다.
엔비디아가 20개 CPU 코어와 128GB 통합 메모리를 갖춘 AI 특화 노트북 칩 'RTX Spark'를 공개하며 윈도우 노트북 시장 공략에 나섰다.
Meta의 AI 지원 챗봇이 이메일 변경 요청을 검증 없이 처리하는 보안 허점이 발견되어 다수의 인스타그램 계정이 탈취됨.
플로리다주가 ChatGPT의 설계가 공공 안전을 위협한다고 주장하며 OpenAI를 상대로 민사 소송을 제기했다.
에이전트 AI를 활용해 Hyperliquid에서 자동 트레이딩 시스템을 구축하고 BetterDB로 API 비용을 최적화하는 과정을 시연한다.
LightGBM 분위수 회귀 모델에서 타겟 인코딩이 학습 데이터의 노이즈를 과적합하여 실제 테스트 성능을 저하시키는 현상을 어블레이션 테스트로 확인했다.
SpaceX가 IPO 신고서를 수정하여 AI 데이터 센터 운영에 필수적인 냉각수 확보를 주요 위험 요소로 새롭게 추가했습니다.
칼로리 추적 앱 Amy의 리텐션 개선을 위해 바코드 스캔, AI 기반 데이터 추출, 수분 추적 기능을 구현한 5개월 차 개발 과정.
Roboflow의 RF-DETR로 선수를 탐지하고 Gemini 2.5 Pro로 전술을 분석하는 자동화된 스포츠 분석 워크플로 구축 가이드.
이미지 생성 모델 평가 시 리더보드 순위보다 품질 대비 비용과 지연 시간을 고려한 파레토 프론트 분석이 더 실질적인 선택 기준이 된다.
LLM 에이전트 파이프라인에서 JSON 직렬화의 토큰 낭비 문제를 지적하고, 이를 40-45% 개선한 실험적 직렬화 엔진 사례를 공유하며 커뮤니티의 대안을 묻는 토론.
MLE-Bench 점수 상승이 실제 알고리즘 발전보다는 모델 성능 향상과 과적합에 기인할 가능성이 높다는 분석과 함께, 이를 검증하기 위한 FML-Bench가 소개되었다.
LogicMark CEO가 AI 기반 디지털 트윈 기술을 활용해 노인 낙상 사고를 사후 대응에서 예측형 안전 관리로 전환하는 방법을 설명한다.
JSON 스키마를 정의하여 PyTorch 및 Lightning 모델을 직접 학습하고 서빙할 수 있는 오픈소스 라이브러리 json2vec을 소개합니다.
영상 속 의류를 자동으로 감지하고 유사 상품을 추천하는 AI 기반 패션 검색 시스템을 구축했다.
구글 수석 과학자 제프 딘과 함께 AI 데이터 부족, 추론 중심의 컴퓨팅 변화, 멀티 에이전트 워크플로 등 AI 기술의 현재와 미래를 논의한다.
Databricks의 Liquid Clustering은 고정된 파티셔닝의 한계를 극복하고 데이터 레이아웃을 유연하게 최적화하여 쿼리 성능과 스토리지 효율을 획기적으로 개선한다.
AI 에이전트의 컨텍스트 윈도우 한계를 극복하고 대화 품질을 유지하기 위한 지식 베이스 최적화 및 상태 관리 전략을 제시한다.
xAI의 Grok Imagine 개발을 주도한 Ethan He가 비디오 생성 모델의 한계와 이를 극복할 비디오 에이전트 및 LLM 중심의 미래를 논한다.
Tailscale의 WireGuard 기반 네트워크 보안 기술을 활용해 API 키 탈취를 방지하고 에이전트 활동을 투명하게 모니터링하는 LLM 게이트웨이 Aperture를 소개한다.
JetBrains가 텍스트와 코드 작업에 최적화된 12B 파라미터의 효율적인 Mixture-of-Experts 모델 Mellum2를 공개했다.
여러 호스트와 머신에서 AI 코딩 에이전트를 중앙 집중식으로 관리하고 모니터링할 수 있는 대시보드 NodeCartel을 소개합니다.
LangSmith Sandboxes는 하드웨어 가상화 기반의 격리된 환경을 제공하여 AI 에이전트가 안전하게 코드를 작성, 실행, 테스트할 수 있도록 지원한다.
LinkedIn이 기존 CPU 기반의 선형 계획법 솔버 DuaLip을 PyTorch 기반 GPU 가속 시스템으로 재설계하여 최적화 성능을 75배 개선했다.
IBM은 엔터프라이즈 워크플로에서 LLM의 컨텍스트를 제어하고 성능과 비용 효율성을 높이기 위해 지식 그래프와 프로그램 분석을 활용한 에이전트 로직을 도입했다.
LLM 에이전트의 예산과 루프 횟수를 강제로 제한하고 안전 장치를 제공하는 Go 기반 셀프 호스팅 도구 RiskKernel.
Mimesis, pandas, NumPy를 조합하여 계절성과 노이즈가 포함된 현실적인 IoT 센서 시계열 데이터를 생성하는 방법.
AI 경제의 GDP 측정 한계, 자동화된 AI 정렬의 난제, Biohub의 단백질 모델 ESMFold2 공개, 그리고 AI 멸종 위험을 경제적으로 평가해야 할 필요성을 다룬다.
Dr. Bradley Allen이 AI의 역사적 흐름과 지식 공학, 신경 기호 AI의 결합을 통해 기업 지능의 미래를 논의한다.
인텔이 엔비디아와 AMD의 시장 지배력에 대응하기 위해 저비용 메모리와 냉각 기술을 적용한 AI 추론 전용 칩 'Crescent Island'를 연내 출시한다.
폐쇄형 모델은 고부가가치 시장을 선점하고, 오픈 모델은 다양한 기업용 에이전트 생태계를 구축하며 서로 다른 경제적 궤적을 그린다.
Physical AI 시대의 도래에 맞춰 로봇 시스템의 구조를 이해하고 실전 프로젝트를 통해 기술적 간극을 메우는 것이 커리어의 핵심이다.
agentgateway는 LLM, MCP, 에이전트 간 트래픽을 단일 데이터 플레인에서 통합 관리하여 인프라 복잡성을 줄이는 오픈소스 게이트웨이이다.
Claude 기반 자율 에이전트 프레임워크 Jork를 통해 콘텐츠 제작과 마케팅 업무를 자동화하고 실제 수익을 창출한 사례.
Claude Desktop과 연동하여 MIDI 기반 악기 장비의 톤 설정을 자연어로 제어할 수 있는 오픈소스 MCP 서버를 개발했다.
MCP 서버 설치 시 발생하는 환경별 설정 파편화 문제를 해결하기 위해 자동화된 설치 패턴과 원자적 파일 쓰기 전략을 제안한다.
Claude가 MCP를 통해 언리얼 엔진의 132개 도구를 제어하고, 변경 후 자동 검증을 통해 배치 오류를 방지하는 오픈소스 프로젝트.
PRL3 PROOF 시스템을 Ubuntu 24.04 환경에 설치하고 의존성 구성 및 벤치마크를 실행하는 자동화 스크립트입니다.
Amazon Bedrock AgentCore Identity가 기존 AWS Secrets Manager 보안 비밀 참조를 지원하여, 사용자가 직접 암호화, 순환 정책, 태그를 관리할 수 있게 개선됐다.
GLQ는 E8 격자 코드북과 Randomized Hadamard Transform을 사용하여 LLM 가중치를 2-8 bpw로 효율적으로 양자화하고, 융합된 CUDA 커널로 추론 속도를 최적화하는 라이브러리입니다.
Claude Code, Cursor, Codex 등 AI 코딩 도구의 사용 기록을 기기 간 동기화하고 히트맵으로 시각화하는 오픈소스 도구 aitrack을 소개한다.
AI 생성 텍스트의 부자연스러운 구조와 미사여구를 제거하여 인간적인 문체로 재작성하는 Claude Code용 스킬 '/humanize'를 개발함.
Claude Opus와 같은 강력한 모델을 활용해 에이전트 간 협업과 작업 가시성을 제공하는 오픈소스 멀티 에이전트 관리 도구인 Agent Teams AI를 소개한다.
Amazon Bedrock AgentCore Gateway가 MCP 서버를 위한 스트리밍, 세션 관리, Elicitation 및 OAuth 2.0 토큰 교환 기능을 추가하여 엔터프라이즈급 제어와 보안을 강화함.
Claude가 불필요한 웹 검색과 도구 호출을 남발하여 비용이 급증하는 문제를 지적하며, 특정 작업에 특화된 버티컬 앱 설계의 필요성을 제기함.
69일간 15만 회 이상의 도구 실행을 기록한 헤비 유저의 Claude Code 사용 패턴을 분석하여, 거대 세션으로 인한 컨텍스트 관리와 비용 효율성 문제를 지적함.
데이터 누수로 인해 테스트셋 성능이 과대평가되는 문제를 지적하며, 실제 환경에서의 모델 성능 검증 필요성을 강조함.
LLM은 구조화된 지시사항을 잘 따르지만 보안 취약점을 놓칠 수 있으므로, 코드 실행 여부만으로 판단하는 '바이브 코딩'은 지양해야 한다.
Amazon Bedrock AgentCore payments는 인프라 계층에서 예산 한도와 권한을 제어하여 AI 에이전트의 안전한 결제를 지원한다.
Amazon Bedrock AgentCore의 Cedar 정책과 Lambda 인터셉터를 결합하여 AI 에이전트의 도구 호출을 동적으로 검증하고 제어하는 보안 아키텍처를 구축합니다.
Anthropic이 미국 증권거래위원회(SEC)에 기업공개(IPO)를 위한 등록 서류를 제출하며 상장 절차에 돌입했다.
LLM을 단순한 엔진으로 활용하고 지속적인 기억과 상태를 갖춘 인지 아키텍처를 통해 프롬프트 제약 없이 자율적으로 행동하는 AI 에이전트 LIA를 구축함.
Claude Code의 작업 결과에 대한 환각 문제를 방지하기 위해, 브리핑-실행-검증의 다중 에이전트 워크플로를 강제하는 도구 Nogra를 소개한다.
Claude Code를 중심으로 보안, 데이터 수집, SEO, 영상 편집을 자동화하는 실무 워크플로우 사례.
AI 코딩 에이전트가 작업을 수행하지 않고 완료했다고 거짓 보고하는 문제를 해결하기 위해, 실제 아티팩트를 검증하여 커밋을 제어하는 워크플로 엔진 KRONOS를 개발함.
Anthropic이 Claude Code에서 제거한 /buddy 기능을 MCP 기반으로 재구현한 Claude Buddy 프로젝트 소개 및 기능 확장 논의.
Claude 기반 거래 AI Pip의 사례를 통해, AI 안전성은 모델의 정렬보다 견고한 아키텍처와 강제적 제약 조건(게이트) 설계에서 비롯됨을 논함.
Claude가 답변 전 반복하는 '가식적인 솔직함' 문구들을 시스템 프롬프트로 원천 차단하여 답변의 간결성을 높이는 방법.
Claude Code와 OpenRouter를 기반으로, 반복되는 교정 패턴을 로컬 규칙으로 학습하여 API 비용을 절감하는 글쓰기 보조 도구 Prose를 개발했다.
Claude Code, Claude Design, ElevenLabs를 조합하여 1달러의 비용으로 18분 분량의 AI 어시스턴트 온보딩 튜토리얼과 가이드를 제작했다.
AI 에이전트의 모든 스킬을 프롬프트에 상시 주입하는 대신, 필요할 때만 활성화하여 컨텍스트를 최적화하는 Thoth의 설계 방식을 소개합니다.
대형 다국어 모델 대신 100M 파라미터 규모의 단일 언어 모델들을 라우팅하여 실시간 음성 인식 성능과 효율을 최적화한 시스템.
WindBorne Systems가 독자적인 기상 관측 풍선 데이터와 개선된 데이터 동화 기술을 활용해 기존 기상 예측 시스템보다 정확한 AI 모델 'WeatherMesh 6'를 출시했다.
16GB RAM을 탑재한 맥북 에어에서 다양한 LLM의 추론 속도와 메모리 점유율을 실측하여, 8B 모델까지가 실사용 가능한 한계임을 확인했다.
Amazon Quick과 MCP를 연동하여 시계열 데이터베이스 KDB-X의 복잡한 쿼리를 자연어 대화로 수행하는 아키텍처를 구축한다.
Amazon FSx for Lustre와 NVIDIA GDS를 결합하여 대규모 LLM 로딩 시간을 획기적으로 단축하고, TurboQuant로 컨텍스트 윈도우를 5배 확장한다.
에이전트 AI의 복잡한 운영 문제를 해결하기 위해 거버넌스, 빌드, 평가, 관측성 등 4가지 핵심 영역을 중심으로 한 AgentOps 프레임워크와 Amazon Bedrock AgentCore 활용법을 제시한다.
Google의 AI 중심 검색 개편에 반발한 사용자들이 늘면서, DuckDuckGo가 'AI 없는 검색'을 강제하는 브라우저 확장 프로그램을 출시하고 트래픽이 급증했다.
Microsoft가 Build 2026에서 첫 자체 추론 모델인 MAI-Thinking-1과 통합 Copilot 슈퍼 앱, Windows 11 개발자 최적화 경험을 발표한다.
25,500건의 LLM 이력서 평가 분석 결과, AI 채용 도구에서 45%의 편향성이 발견되었으며 모델별 안정성 격차가 6배에 달해 규제 준수 리스크가 확인됨.
NVIDIA가 360도 인식과 고수준 추론을 지원하는 32B 규모의 로보택시용 파운데이션 모델 Alpamayo 2 Super를 공개했다.
Claude Code의 세션 간 기억력 문제를 해결하기 위해 CLAUDE.md 파일 활용과 Mem0 기반의 자동 메모리 추출 시스템을 제안한다.
Anthropic의 연구 결과를 바탕으로 AI 코딩 시 인지 부하를 줄이고 기술 퇴화를 방지하기 위해 마크다운 대신 HTML 대시보드를 사용하는 워크플로우를 설계했다.
Claude가 직접 코드 수정, CLI 실행, DB 쿼리를 수행할 수 있도록 Magento 개발 환경을 GitHub Codespaces 기반으로 자동화한 오픈소스 스타터 키트.
Claude Code 환경에서 작업 내용과 영감을 바탕으로 사용자의 문체에 맞춰 트윗 초안을 자동 생성하는 도구인 tweet.rip을 소개한다.
Claude를 활용해 Reddit 게시물에서 잠재 고객과 질문을 선별하고 학습을 통해 정확도를 높이는 로컬 실행형 리드 발굴 도구.
AI 에이전트가 SEO 기반 웹 검색 대신 3만 권 이상의 퍼블릭 도메인 도서를 검색하여 창의적이고 전략적인 답변을 생성하도록 돕는 MCP 서버 'ShelfLayer'를 개발했다.
Claude가 MCP를 통해 FormProxy API를 호출하여 생성된 HTML 폼에 작동하는 백엔드 엔드포인트를 즉시 주입하는 도구입니다.
Claude의 메시지 제한 문제를 해결하기 위해 Runable을 활용한 동적 모델 라우팅, 컨텍스트 프루닝, 루프 보호 전략을 적용한 사례.
Strava가 무분별한 AI 스크래핑과 API 과부하 문제를 해결하기 위해 개발자 API 접근을 월 11.99달러 유료 구독 모델로 전환한다.
레코딩 아카데미 CEO 하비 메이슨 주니어가 AI가 음악 산업에 미치는 영향과 그래미 어워드의 인간 창의성 보호 정책을 논한다.
ElevenLabs 개발자가 Cursor와 멀티모달 API를 조합해 2시간 만에 동상과 대화하는 앱을 구축하고 150만 조회수를 기록한 사례.
하위 에이전트 방식의 한계를 극복하기 위해 MCP를 활용하여 독립적이고 지속적인 LLM 세션 간 피어 투 피어 통신 아키텍처를 설계하고 커뮤니티의 피드백을 구함.
AI 에이전트의 실전 실패는 모델 자체보다 RAG 청킹 전략, 프롬프트 테스트 부족, 예외 처리 로직 부재에서 기인한다.
AI 에이전트를 팀의 일원으로 통합하여 업무 효율을 높이고 직원들의 창의적 문제 해결 능력을 극대화하는 조직 문화 구축 전략을 제시한다.
튜터링 플랫폼에서 Claude를 활용해 학부모용 세션 요약을 자동화하며, 40번의 프롬프트 반복 개선을 통해 단순 요약에서 개인화된 장기 추적 데이터로 발전시킨 사례.
Claude Code에 커스텀 스킬을 추가하여 복잡한 업무를 작은 단위로 자동 분해하고 순차적으로 처리하는 워크플로를 구축했다.
Claude Code가 소셜 미디어 게시물 예약 및 분석을 수행할 수 있도록 돕는 Publora MCP 서버가 공개되었습니다.