Claude Code 터미널 속 ASCII 펫? 'Bones and Soul' 아키텍처의 비밀
Claude Code의 '/buddy' 명령어가 결정론적 스탯과 LLM 생성 페르소나를 결합한 'Bones and Soul' 아키텍처로 구현된 방식에 대한 기술 정보.
총 100건
Claude Code의 '/buddy' 명령어가 결정론적 스탯과 LLM 생성 페르소나를 결합한 'Bones and Soul' 아키텍처로 구현된 방식에 대한 기술 정보.
SpLR_V2 활성화 함수와 DNA 변이 엔진을 통해 학습 정체와 모드 붕괴를 해결하는 새로운 딥러닝 아키텍처 MACRO-DREADNOUGHT가 공개되었습니다.
LLM 호출 비용을 추적하고 OpenTelemetry와 연동하여 정교한 비용 할당 및 관측성을 제공하는 Python 라이브러리입니다.
Claude에게 코드베이스 지속성 메모리를 부여해 토큰 사용량을 최대 99%까지 절감하는 오픈소스 도구 Ix가 공개되었다.
AI 코딩 시 발생하는 반복적 오류와 문맥 망각을 해결하기 위해, 구현 전 의사결정 단계를 강제하고 기록하는 Go 기반 TUI 도구 'defer'를 소개합니다.
ChatGPT를 엄격한 규칙 기반 시스템으로 오해하여 발생하는 7가지 기술적 한계와 이를 극복하기 위한 '조종(Steering)' 관점의 접근법을 공유했다.
Git 워크트리와 AST 하이퍼그래프를 활용해 저비용 모델로도 복잡한 엔지니어링 작업을 수행하는 자율 코딩 에이전트 오케스트레이터 Forge를 개발했다.
LLM 없이 경량 임베딩과 리랭킹만으로 Banking77 데이터셋에서 94.42%의 정확도와 높은 효율성을 달성했다.
사용자의 입력을 상태(State)로 관리하고 다양한 이미지 생성기용 페이퍼크래프트 도안 프롬프트를 생성하는 고도로 구조화된 프롬프트 프레임워크이다.
Microsoft Presidio와 spaCy를 활용하여 LLM 및 벡터 DB에 도달하기 전 실시간으로 개인정보를 마스킹하는 법률 AI 챗봇 아키텍처를 공유함.
LLM이 방대한 학습 데이터를 통해 개별 문서에는 없는 도메인 간 공통 구조적 패턴을 가중치에 인코딩하며, 이를 '측면 변위' 프롬프팅으로 추출할 수 있다는 가설에 대한 토론이다.
프롬프트 복잡도에 따라 모델을 동적으로 선택하는 라우팅 전략을 통해 금융 작업에서 평균 60%의 비용 절감 효과를 입증했다.
자율형 AI 에이전트 도입이 확산되고 있으나, 오류 발생 시 책임 소재에 대한 법적 프레임워크와 벤더들의 보증이 부재한 상황이다.
Anthropic이 Google 및 Broadcom과 수 기가와트 규모의 차세대 TPU 공급 계약을 체결하며 하드웨어 다변화와 인프라 확장에 나섰다.
OmniForge는 로컬 및 클라우드 환경에서 Hugging Face 모델의 LoRA 파인튜닝과 GGUF 변환을 지원하는 오픈소스 CLI 도구이다.
Generalist가 50만 시간 이상의 인간 작업 데이터를 학습하여 생산 현장에 투입 가능한 수준의 정교함을 갖춘 물리 AI 모델 GEN-1을 발표했다.
기존 로봇 AI(VLA)는 학습 데이터와 조금만 다른 환경에서도 쉽게 실패하는 한계가 있었다. 이 논문은 비디오 데이터를 통해 세상의 물리 법칙을 먼저 배운 '세계 행동 모델(WAM)'이 이러한 변화에 훨씬 더 강하다는 것을 입증하며, 미래 로봇 제어의 새로운 방향성을 제시한다.
대조 학습 기반 CLIP과 자기 지도 학습 기반 DINO 인코더를 결합하여 시각 이해 및 그라운딩 성능을 극대화한 CoME-VL 프레임워크.
LangGraph와 샌드박스 기반으로 구축된 금융 특화 풀스택 AI 에이전트 프레임워크 LangAlpha의 아키텍처와 주요 기능이 공개됐다.
OpenAI의 초기 멤버들이 설립한 벤처 캐피털 'Zero Shot'이 1억 달러 목표 중 1차 클로징을 완료하고 본격적인 AI 스타트업 투자를 시작했다.
2026년 1분기 벤처 투자액이 3,000억 달러를 기록하며 AI 집중 현상이 심화되는 가운데, 메타의 AI 보안 사고와 헬스케어 분야의 음성 기반 심부전 진단 기술 등 주요 소식을 다룹니다.
MIT는 AI의 업무 능력이 아직 '최소 수준'이라 평가했으며, Deloitte는 AI 환각 오류로 정부 보고서 신뢰도 추락과 환불 사태를 겪고 있다.
CrewAI의 5개 전문 에이전트 워크플로우를 통해 수동 고객 관리의 한계를 극복하고 연간 50만 건의 자동화된 고객 활성화를 달성한 사례를 담고 있다.
OpenAI가 초지능 시대의 위험 관리와 인류 편익을 위한 정책 제안을 발표한 가운데, 샘 알트먼 CEO의 신뢰성을 의심하는 심층 보도가 동시에 나왔다.
LLM이 개인화된 에이전트로 진화하며 발생하는 문맥적 프라이버시 침해 문제를 분석하고, 데이터 최소화 및 소크라테스식 추론(Socratic CoT)을 통한 기술적 해결 방안을 제시합니다.
AI 출력물의 독립적 검증을 위한 AI 신뢰 스택 프레임워크와 암호화 기반 데이터 무결성 기술의 필요성이 확인됐다.
OpenAI의 기록적인 자금 조달 성공과 내부 경영진 개편, 그리고 Anthropic과의 IPO 경쟁 등 AGI 시대를 앞둔 AI 업계의 긴박한 움직임을 다룹니다.
RF-DETR 모델과 Roboflow Workflows를 활용해 수술 전후 트레이 이미지를 비교함으로써 수술 도구 누락을 자동 방지하는 시스템 구축 가이드이다.
Behavior Cloning과 HG-DAgger를 결합하여 Resident Evil의 긴박한 탈출 시퀀스를 수행하는 AI 에이전트를 구현했다.
AI 활용 능력을 단순 도구가 아닌 복리 효과가 적용되는 기술 자산으로 인식하고 조기에 습득하여 장기적인 경쟁력을 확보해야 한다.
EvalLens는 LLM이 생성한 JSON 등 구조화된 데이터의 스키마 일치 여부와 값의 정확도를 행 단위로 비교하고 상세한 오류 원인을 분석하는 오픈소스 평가 도구이다.
AWS와 Windward는 Amazon Bedrock과 Step Functions를 활용해 해상 이상 징후를 자동으로 분석하고 맥락화된 보고서를 생성하는 AI 에이전트 솔루션을 구축했다.
Amazon Bedrock과 OpenSearch Serverless를 결합하여 시맨틱 검색의 문맥 이해와 텍스트 검색의 정확도를 동시에 확보하는 에이전트 기반 하이브리드 검색 구현 가이드이다.
샘 알트먼의 AI 정책 제안과 OpenAI의 재무적 위기, 그리고 '바이브 코딩'으로 인한 앱 스토어 제출 급증 등 주요 AI 트렌드를 다룹니다.
Claude Code의 시스템 프롬프트에 'Compliance Canary' 설정을 추가하여 모델의 확신도, 잠재적 오류, 숨겨진 의도를 매 답변마다 강제로 노출시키는 기법이다.
ADR을 슬라이싱하여 전문 서브 에이전트(Bebop, Baxter, Krang)에게 할당하고 Sonnet으로 구현하는 멀티 에이전트 시스템이다.
100개 이상의 앱 빌드 경험을 통해 정립한 프론트엔드 중심의 AI 협업 개발 프레임워크와 배포 전략을 공유한다.
데이터 엔지니어링 역량이 AI 시스템 구축의 핵심이며, 두 역할이 실무적으로 통합되고 있음을 강조한다.
Anthropic의 AI 코딩 에이전트 Claude Code가 2003년부터 리눅스 커널에 존재했던 NFSv4.0 힙 버퍼 오버플로우 취약점을 발견했다.
Anthropic의 Boris가 Claude Code의 사고 과정 가시성 변경, Opus 4.6의 적응형 사고 도입 및 노력(Effort) 설정 최적화에 대해 상세히 설명했다.
AI 코딩 어시스턴트 Antigravity를 활용해 보안 검증과 백엔드 엔진을 구축한 오픈소스 NVR 프로젝트 VibeNVR의 개발 워크플로우이다.
Cursor의 AI 규칙과 프로젝트의 실제 CI/린트 설정을 일치시켜주는 오픈소스 CLI 도구 crag가 공개됐다.
비디오 생성 모델을 낮은 추론 비용(2-4 NFE)으로 증류하면서도 품질을 유지하는 SC-DMD 및 캐시 인식 학습 기법인 Salt를 제안한다.
전문 영역의 복잡한 작업을 평가하기 위해 1,346개의 전문가 작업과 루브릭 기반 평가 시스템을 도입한 고충실도 벤치마크 XpertBench가 공개됐다.
시각 언어 모델(VLM)이 텍스트로 명명할 수 없는 시각적 세부 정보를 무시하고 언어적 개념(시맨틱 앵커)에 의존하여 추론한다는 연구 결과이다.
컴퓨터 사용 에이전트가 개별적으로는 정상인 단계를 조합해 유해한 결과를 초래하는지 평가하는 2,653개 사례 기반의 벤치마크 AgentHazard를 개발했다.
Swift-SVD는 활성화 기반 공분산 집계와 동적 랭크 할당을 통해 LLM 압축 속도를 최대 70배 높이면서도 이론적 최적 성능을 보장한다.
AI 에이전트가 팀을 이루어 사용자의 일상(일정, 건강, 금융)을 관리하는 시대가 오고 있지만, 이들 간의 협력 과정에서 발생하는 개인정보 유출 위험은 간과되어 왔다. 이 논문은 에이전트 간 소셜 상호작용에서 발생하는 새로운 보안 취약점을 체계적으로 분석하고, 단순한 프롬프트 엔지니어링만으로는 해결할 수 없는 '추상화의 역설'을 발견하여 안전한 에이전트 시스템 구축을 위한 방향성을 제시한다.
하드웨어 제약과 오류 수정 과정을 학습하여 칩 설계 및 GPU 최적화 등 산업용 코드 생성 성능을 극대화한 InCoder-32B-Thinking 모델이 공개됐다.
MLLM이 서로 다른 시점의 정보를 대화로 통합해 공유된 공간 모델을 형성하는 능력을 평가하는 COSMIC 벤치마크가 제안됐다.
기존의 LLM 학습 법칙은 학습 단계의 효율성만 강조했지만, 실제 서비스에서는 추론 비용이 전체 예산의 큰 비중을 차지합니다. 이 논문은 추론 시 여러 번 시도하여 정답을 찾는 '테스트 시간 스케일링' 상황을 고려할 때, 모델을 기존 상식보다 훨씬 더 많이 학습(오버트레이닝)시키는 것이 전체 비용 대비 성능 면에서 가장 유리함을 수학적으로 입증했습니다.
멀티모달 모델의 도구 활용 및 검색 능력을 과정 중심으로 정밀 평가하는 418개 과제 기반의 벤치마크 Agentic-MME가 제안됐다.
MLLM의 시점 이해도를 높이기 위해 ViT 토큰을 직접 기하학적으로 변환하는 역방향 토큰 워핑 기법을 통해 왜곡을 줄이고 추론 성능을 개선했다.
복잡한 메모리 구조 대신 최근 프레임만 사용하는 슬라이딩 윈도우 방식의 SimpleStream이 기존 스트리밍 비디오 모델들을 능가하는 성능을 보임을 입증했다.
RLVR의 안정성과 자기 증류의 정밀함을 결합하여 정보 누출을 방지하고 LLM 학습 성능을 극대화하는 RLSD 프레임워크이다.
LLM이 추론 중 백엔드 상태(안전성, 메모리 등)를 저비용으로 조회하여 불필요한 추론 분기를 줄이는 'inner_bus' 아키텍처 제안이다.
코드베이스를 텍스트 청크가 아닌 함수·클래스 간의 관계 그래프로 인덱싱하여 AI 에이전트에게 정밀한 컨텍스트를 제공하는 MCP 서버입니다.
AI 에이전트의 무중단 배포는 단순 시스템 가동률을 넘어 할루시네이션과 컨텍스트 유지를 포함한 '기능적 가동률' 관리가 핵심이다.
Claude Code의 /resume 기능 사용 시 발생하는 급격한 토큰 소모 문제와 이를 방지하기 위한 마크다운 기반 컨텍스트 백업 및 도구 병행 사용법을 정리했다.
서로 다른 AI 에이전트 CLI 간에 스레드를 공유하고 유닉스 도구처럼 파이프로 연결할 수 있게 해주는 통합 CLI 도구 'oneagent'가 공개됐다.
Claude Code가 생성하는 Matplotlib 차트의 디자인 품질을 높이기 위한 오픈 소스 전용 스킬이 공개됐다.
Claude Code를 활용해 24/7 자동화 시스템을 구축한 후, 플랫폼의 기능 고도화에 맞춰 커스텀 레이어를 과감히 제거하며 얻은 기술적 부채 관리의 교훈을 공유한다.
Plannotator UI 내에서 Claude Code 기반의 AI 에이전트가 코드 차이점(diff)에 주석을 다는 자동 리뷰 기능이 추가됐다.
기기 내부에서 로컬로 작동하는 1GB 규모의 소형 언어 모델(SLM)을 활용하여 프라이버시와 저지연을 보장하는 AI 일기 앱 프로젝트이다.
Rust와 TUI를 활용해 Claude Code와 Codex를 통합하고 멀티 워크트리 병렬 작업을 지원하는 AI 개발 환경 AZUREAL이 공개됐다.
심리적 압박으로 일을 시작하지 못하는 사람들을 위해 AI가 작업을 최소 단위로 분할해주는 생산성 앱 'Small Wins' 개발기이다.
여러 AI 모델의 답변을 비교 요약하고, 사용자의 컨텍스트를 다양한 에이전트에서 공유할 수 있게 돕는 Modelmash와 ContextOS 프로젝트이다.
Cline Kanban의 병렬 작업 기능을 사용하여 Vitest 설정부터 80% 커버리지 제한이 포함된 CI 파이프라인 구축까지 자동화한 사례이다.
Andrej Karpathy의 지식 관리 방식을 벤치마킹하여 Ollama와 LangChain으로 Mac 로컬 환경에서 작동하는 지식 베이스 에이전트를 개발하고 소스 코드를 공유했다.
ATLAS는 검증 파이프라인과 도구 호출 기능을 통해 9B 소형 모델로도 상용 모델을 능가하는 로컬 코딩 에이전트 성능을 입증했다.
구글이 Gemma 모델 기반의 오프라인 AI 받아쓰기 앱 'Google AI Edge Eloquent'를 iOS에 출시하여 실시간 교정 및 요약 기능을 제공한다.
Claude Code의 멀티 에이전트 작업 상태와 에이전트별 할당 현황을 VS Code 내에서 칸반 보드로 시각화해주는 도구이다.
여러 개의 AI 프로젝트를 관리하고 Claude가 코드와 Git 이력을 파악해 우선순위를 추천하는 오픈소스 포트폴리오 관리 도구 VibeFocus가 공개됐다.
Claude Code 세션에 의미 있는 제목을 자동으로 부여하여 작업 이력 관리를 돕는 오픈소스 도구 claude-rename이 공개됐다.
파일 시스템을 메시지 버스로 활용해 여러 Claude Code 인스턴스가 서로 정보를 주고받으며 협업할 수 있게 돕는 경량 오픈소스 도구이다.
에이전트 스웜 대신 명확한 단계와 노드로 구성된 시각적 AI 워크플로우의 중요성을 전하며, MCP 연동이 가능한 Gumflow 플랫폼을 공개했다.
Anthropic의 구독 모델과 API 간의 충돌을 해결하기 위해 전용 엔드포인트 분리, 사용량 시각화, 공식 OAuth 도입을 골자로 하는 아키텍처 재설계안이다.
OpenAI Whisper와 Claude Code를 활용해 기존의 비싼 전사 서비스를 대체하는 고효율 서버리스 아키텍처 구축 사례를 공유함.
AI 코딩 어시스턴트의 '비위 맞추기'식 테스트 조작 위험을 경고하며, 시스템 안정성을 위해 80% 이상의 테스트 커버리지 확보를 강조함.
Flutter와 Google ML Kit, Claude API를 활용해 AI 피클볼 폼 코칭 앱을 개발하고 Apple의 엄격한 심사 과정을 통과한 1인 개발자의 경험담이다.
ChatGPT를 활용해 복잡한 고민을 해결하고 신속하게 의사결정을 내릴 수 있도록 돕는 7단계 프롬프트 시스템을 권고한다.
Amazon SageMaker AI의 서버리스 모델 커스터마이징과 RLVR 기법을 활용해 Qwen 2.5 7B 모델의 도구 호출 정확도를 57% 향상시키는 방법과 실무 사례를 제시합니다.
Claude Code와 Codex CLI의 실시간 사용량을 메뉴바에서 간편하게 모니터링하고 관리할 수 있는 오픈소스 도구 AIPace가 공개됐다.
AI 에이전트가 생성한 웹사이트를 즉시 배포하고 공유 가능한 URL을 생성해주는 서비스 ShipStatic이 공개되었습니다.
여러 AI 에이전트를 무한 캔버스에서 시각적으로 배치하고 관리할 수 있는 macOS용 경량 터미널 도구 Korum이 공개되었다.
AI 코딩 시 발생하는 천편일률적인 UI 문제를 해결하기 위해 텍스트 프롬프트 대신 실제 CSS 디자인 시스템 파일을 컨텍스트로 제공하는 방법이 효과적임이 확인됐다.
AI로 코드를 생성하는 'Vibe Coding'의 보안 취약점을 경고하며, 데이터 유출 방지를 위한 17가지 체크리스트와 AI를 활용한 검증 방법을 공유한다.
복잡한 입력을 작은 단위로 분할하여 개별 처리하는 'Double-Call Architecture'를 통해 LLM의 문맥 소실 문제를 해결했다.
AI 에이전트의 오작동 원인이 프롬프트가 아닌 툴 스키마 및 설정의 버전 불일치임을 밝히고, 실행 전 해시 검증을 통한 배포 관점의 접근 방식을 도입했다.
비즈니스 성장용 AI(Vibegrowing)를 위해 설계된 Ultron의 5계층 아키텍처와 전문 에이전트 협업 및 메모리 관리 시스템.
LangGraph 등 AI 에이전트가 외부 시스템에 접근할 때 Ed25519 서명 영수증을 생성하여 규제 준수(Compliance)를 증명하는 오픈소스 도구 'agentmint'가 공개됐다.
Meta는 50개 이상의 전문 AI 에이전트를 활용해 대규모 코드베이스의 암묵적 지식을 추출하고, 이를 AI 에이전트용 내비게이션 가이드로 변환하는 사전 연산 엔진을 구축했다.
AI 업무 노출도만으로는 실제 고용 변화를 예측하기 어려우며 산업별 가격 탄력성 데이터를 수집하는 국가적 노력이 필요하다.
OpenAI가 AI로 인한 노동 시장 변화와 부의 집중 문제를 해결하기 위해 공공 부금 펀드와 조세 제도 개편을 포함한 정책 문서를 공개했다.