Chase AILLM조회 3회

Claude Code 성능을 극대화하는 5가지 필수 오픈소스 도구

Claude Code와 연동하여 모델 성능을 자동 개선하고 외부 소프트웨어 및 구글 서비스를 제어하며 에이전트 간 협업을 가능하게 하는 5가지 최신 오픈소스 프로젝트를 소개한다.

챕터별 상세

00:20

Andrej Karpathy의 AutoResearch: ML 실험 자동화 루프

AutoResearch는 머신러닝 알고리즘을 자동으로 개선하는 프레임워크이다. 시스템은 prepare.py(스코어링), train.py(에이전트 수정 대상), program.md(규칙 및 제약 조건)의 세 가지 핵심 파일로 작동한다. 에이전트는 가설을 세우고 train.py 코드를 수정한 뒤 실행하여 결과 점수를 확인하며 점수가 개선되면 변경 사항을 커밋하고 그렇지 않으면 롤백하는 과정을 반복한다. Shopify CEO인 Tobi Lutke는 이 도구를 사용하여 0.8B 파라미터 모델의 효율성을 19% 향상시켰다. 다만 주관적인 평가가 필요한 작업보다는 Yes/No 혹은 수치로 명확히 평가 가능한 작업에 최적화되어 있다.

이 루프는 강화학습의 보상 체계와 유사하게 작동하며 에이전트가 스스로 코드를 최적화하도록 유도한다.

06:12

OpenSpace: 에이전트 기술의 자가 진화 시스템

OpenSpace는 에이전트가 수행하는 기술을 모니터링하고 스스로 개선하는 MCP(Model Context Protocol) 서버이다. 기술의 실행 결과를 분석하여 Auto-fix(오류 즉시 수정), Auto-improve(성공 패턴 강화), Auto-learn(사용 패턴 캡처)의 세 가지 방식으로 기술을 진화시킨다. 홍콩대학교 데이터 지능 연구소(HKUDS)에서 개발했으며 에이전트가 반복적인 작업을 줄여 토큰 사용량을 46% 절감하고 실제 업무 성과를 4.2배 향상시킨다는 벤치마크 결과를 보유하고 있다. 6개의 초기 기술로 시작하여 60개 이상의 복잡한 기술이 포함된 대시보드를 구축하는 데 성공했다.

MCP는 LLM이 외부 도구나 데이터에 접근할 수 있도록 정의된 표준 프로토콜이다.

09:23

CLI-Anything: 모든 소프트웨어의 에이전트화

CLI-Anything은 GUI 기반의 오픈소스 소프트웨어를 에이전트가 제어할 수 있는 CLI 도구로 자동 변환한다. 에이전트가 소스 코드를 분석하고 GUI 액션을 API에 매핑한 뒤 테스트와 문서화까지 수행하는 7단계 파이프라인을 거쳐 CLI를 생성한다. 이를 통해 Claude Code는 GIMP, Blender, Audacity와 같은 복잡한 소프트웨어를 직접 명령어로 제어할 수 있게 된다. 기존의 불안정한 UI 자동화나 제한적인 API의 한계를 극복하고 에이전트와 소프트웨어 간의 간극을 좁히는 역할을 한다.

에이전트가 직접 마우스를 클릭하는 방식이 아니라 소프트웨어 내부 로직을 명령어로 호출하는 방식이다.

10:35

Claude Peers MCP: 멀티 에이전트 협업 워크플로우

Claude Peers는 서로 다른 터미널에서 실행 중인 Claude 인스턴스들이 서로를 발견하고 메시지를 주고받게 하는 도구이다. SQLite 데이터베이스와 MCP 서버를 기반으로 작동하며 각 세션의 요약 정보를 공유하여 맥락을 유지한다. 이는 Anthropic이 제안한 'Long-running application development' 개념을 구현한 것으로 기획자, 실행자, 평가자 역할을 나누어 에이전트 팀을 운영할 수 있게 한다. 특히 LLM이 자신의 결과물을 스스로 평가할 때 발생하는 편향을 방지하기 위해 별도의 평가 세션을 운영하는 데 효과적이다.

단일 세션의 컨텍스트 제한을 극복하고 복잡한 작업을 분업화하기 위한 아키텍처이다.

12:52

Google Workspace CLI: 구글 생태계와 Claude의 통합

Google Workspace CLI(gws)는 Claude Code가 Google Drive, Gmail, Calendar 등 구글의 모든 서비스에 접근할 수 있게 한다. 구글 개발자들이 만든 비공식 프로젝트로 40개 이상의 에이전트 전용 기술이 포함되어 있다. 특히 보안을 위해 구글의 Model Armor를 통합하여 프롬프트 인젝션(Prompt Injection) 공격을 사전에 스캔하고 차단하는 기능을 갖추고 있다. 사용자는 특정 폴더나 이메일 계정만 접근 가능하도록 샌드박싱하여 보안 리스크를 관리하면서 개인 비서로서의 기능을 극대화할 수 있다.

Model Armor는 입력된 프롬프트나 모델의 응답이 안전한지 검사하는 구글의 보안 레이어이다.

언급된 리소스

GitHubAutoResearch GitHub

GitHubOpenSpace GitHub

GitHubCLI-Anything GitHub

GitHubClaude Peers MCP GitHub

GitHubGoogle Workspace CLI GitHub

문서Anthropic Blog: Harness design for long-running application development

AI 분석 전체 내용 보기

AI 요약 · 북마크 · 개인 피드 설정 — 무료

출처 · 인용 안내

원문 발행 2026. 03. 29.수집 2026. 03. 29.출처 타입 YOUTUBE

인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.