WorldofAIAI/ML조회 10회

클로드 코드 2.0 대규모 업데이트: /loop 명령과 에이전트 스킬 2.0 도입

앤스로픽의 클로드 코드가 스케줄링 명령, 에이전트 평가 도구, 오피스 통합 및 향상된 메모리 관리 기능을 포함한 대규모 업데이트를 공개했다.

이 소스 글 더 보기 원문 보기

핵심 요약

이번 업데이트는 단순한 기능 추가를 넘어 에이전트의 메모리 관리, 작업 자동화 스케줄링, 정량적 성능 평가 도구인 에이전트 스킬 2.0을 도입하여 개발 생산성을 극대화했다. 특히 터미널 환경과 오피스 소프트웨어 간의 통합을 강화하여 실무 활용도를 높였다.

배경

앤스로픽(Anthropic)의 터미널 기반 AI 코딩 에이전트인 클로드 코드(Claude Code)가 기능과 성능 면에서 대대적인 업데이트를 진행했다.

대상 독자

AI 코딩 도구를 활용하는 개발자 및 AI 에이전트 구축에 관심 있는 엔지니어

의미 / 영향

클로드 코드가 단순한 채팅 인터페이스를 넘어 스스로 작업을 스케줄링하고 성능을 자가 진단하는 완성형 에이전트 플랫폼으로 진화했다. 개발자는 반복적인 관리 업무를 에이전트에게 위임하고, 정량적인 평가 지표를 바탕으로 더 신뢰할 수 있는 AI 워크플로우를 구축할 수 있게 되었다. 특히 오피스 소프트웨어와의 통합은 개발 외 영역에서도 AI 에이전트의 활용 범위를 크게 넓힐 것이다.

챕터별 상세

00:32

맥락을 유지하는 빠른 질문 /btw 명령

/btw 명령은 현재 진행 중인 대화 기록에 영향을 주지 않고 클로드에게 빠른 질문을 던질 수 있는 기능이다. 긴 작업 도중 특정 로직의 의미를 묻거나 간단한 정보를 확인할 때 메인 컨텍스트를 오염시키지 않고 답변을 얻을 수 있다. 이는 클로드가 장기적인 작업 흐름에서 벗어나지 않으면서도 멀티태스킹을 수행할 수 있도록 돕는다.

•대화 히스토리에 추가되지 않는 독립적인 질문 처리 기능
•장기 실행 작업 중 컨텍스트 오염 방지 및 빠른 정보 확인 가능

00:56

/loop 명령을 통한 작업 자동화 스케줄링

/loop 명령은 크론(Cron) 스타일의 스케줄링 시스템을 클로드 코드에 도입했다. 사용자는 특정 시간 간격으로 프롬프트를 반복 실행하도록 설정할 수 있으며, 예를 들어 매일 아침 9시에 최근 머지된 PR 요약을 생성하도록 명령할 수 있다. 이는 로컬 세션 수준에서 작동하는 임시 스케줄러 역할을 수행한다.

•Cron 표현식을 활용한 반복적 프롬프트 실행 자동화
•PR 요약, 상태 업데이트 확인 등 반복 업무의 에이전트화

01:48

데스크톱 앱의 예약 작업 및 외부 알림 연동

클로드 코드 데스크톱 앱에 예약 작업(Scheduled Tasks) 기능이 추가되어 컴퓨터가 켜져 있는 동안 지속적인 워크플로우를 실행한다. 데일리 코드 리뷰나 의존성 보안 점검 등을 자동화할 수 있으며, 텔레그램(Telegram) 봇 빌더 스킬을 연동하여 작업 결과를 모바일로 즉시 전송받는 것도 가능하다. 로컬 환경의 자원을 활용하므로 복잡한 서버 설정 없이도 자동화 파이프라인 구축이 가능하다.

•데스크톱 환경 기반의 지속적 워크플로우 자동화
•텔레그램 API 연동을 통한 작업 결과 외부 알림 시스템 구축

03:20

시스템 프롬프트 업데이트와 메모리 구조화

시스템 프롬프트가 버전 2.1.74로 업데이트되면서 메모리 작성 규칙이 강화됐다. 클로드는 이제 자동 메모리(Auto-memory) 디렉토리가 이미 존재함을 인지하고 불필요한 디렉토리 생성 명령을 생략하여 토큰 소모를 줄인다. 또한 모든 메모리는 규칙/사실, 동기, 적용 방식의 구조화된 템플릿으로 저장되어 세션 간 컨텍스트 복구 정확도가 향상됐다.

•불필요한 도구 호출을 줄이는 효율적인 시스템 프롬프트 최적화
•메모리 저장 시 구조화된 템플릿 강제로 정보 회수 정확도 개선

05:38

에이전트 스킬 2.0과 정량적 평가 시스템

에이전트 스킬(Agent Skills) 2.0은 코딩 없이도 에이전트의 능력을 테스트하고 정제할 수 있는 환경을 제공한다. 평가(Evals) 기능을 통해 특정 작업에 대한 에이전트의 성공률을 측정하고, 벤치마크 모드로 모델 업데이트 시 발생할 수 있는 성능 저하(Regression)를 감지한다. PDF 폼 채우기 테스트에서 좌표 인식 오류를 발견하고 수정한 사례처럼 구체적인 성능 개선 루프를 지원한다.

•에이전트 성능을 수치화하여 측정하는 평가(Evals) 시스템 도입
•멀티 에이전트 지원 및 모델 변경에 따른 성능 변화 벤치마킹 기능

07:21

추론 노력 수준 조절 및 코드 리뷰 시스템

세션 시작 시 추론 노력(Effort Level)을 낮음, 중간, 높음 중 선택할 수 있어 작업의 복잡도에 따른 비용과 시간을 제어한다. 또한 앤스로픽 내부에서 사용하던 멀티 에이전트 코드 리뷰 시스템이 도입되어 인간이 놓치기 쉬운 버그를 잡아낸다. 이 시스템은 팀 및 엔터프라이즈 사용자에게 제공되며 PR 승인 전 최종 검증 단계에서 높은 신뢰도를 제공한다.

•작업 난이도에 따른 추론 자원(Effort) 선택 기능으로 비용 최적화
•앤스로픽 내부 기술 기반의 고성능 멀티 에이전트 코드 리뷰 도구

실무 Takeaway

/btw 명령을 활용하면 현재 코딩 컨텍스트를 유지하면서도 흐름을 끊지 않고 외부 정보를 검색하거나 질문할 수 있다.
/loop와 데스크톱 예약 작업을 조합하여 매일 반복되는 보안 취약점 점검이나 의존성 업데이트 확인을 자동화할 수 있다.
에이전트 스킬 2.0의 평가(Evals) 도구를 사용하면 프롬프트 수정이 실제 성능 향상으로 이어지는지 데이터로 검증 가능하다.

언급된 리소스

문서Improving skill-creator: Test, measure, and refine Agent Skills

API DocsClaude Code Scheduled Tasks Documentation

AI 분석 전체 내용 보기

AI 요약 · 북마크 · 개인 피드 설정 — 무료