AGENTS.md 작성 가이드와 최신 AI 모델 업데이트 (GPT-5.4 mini, MiniMax-M2.7)

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

AI 에이전트의 성능을 최적화하기 위해서는 AGENTS.md 파일에 기술 스택 같은 중복 정보를 넣기보다 사용자의 선호도와 행동 교정 지침을 담는 것이 중요하다. 최근 연구에 따르면 불필요한 정보는 비용을 20% 증가시키고 성능을 저하시키는 것으로 확인되었다. 이와 함께 OpenAI의 GPT-5.4 mini와 MiniMax의 M2.7 모델이 출시되어 코딩 및 추론 성능에서 새로운 기준을 제시하고 있다. 구글의 Stitch와 클로드의 Dispatch 등 에이전트 활용을 돕는 새로운 도구들도 대거 공개되어 AI 개발 생태계가 더욱 확장되고 있다.

배경

LLM 시스템 프롬프트에 대한 기본 이해, AI 에이전트 및 코딩 보조 도구 사용 경험, 벤치마크 지표(SWE-bench 등)에 대한 기초 지식

대상 독자

AI 에이전트를 개발하거나 프로덕션 환경에서 LLM을 활용하는 엔지니어 및 데이터 과학자

의미 / 영향

에이전트 지침 최적화 방법론이 정립됨에 따라 토큰 낭비를 줄이고 에이전트의 정확도를 높일 수 있게 되었다. 또한 GPT-5.4 mini와 같은 고효율 모델의 등장은 AI 서비스의 운영 비용을 획기적으로 낮추는 계기가 될 것이다.

섹션별 상세

AGENTS.md와 CLAUDE.md는 에이전트가 대화를 시작하기 전 참조하는 지침 파일로, 시스템 프롬프트에 사용자의 특정 요구사항을 추가하여 에이전트의 행동을 제어한다.

text

my-project/
├── AGENTS.md ← root instructions (always loaded)
└── docs/
    └── AGENTS.md ← loaded when agent works in /docs

프로젝트 폴더 구조에 따른 AGENTS.md 파일의 계층적 로드 방식 예시

최근 연구에 따르면 AGENTS.md에 기술 스택이나 파일 구조를 상세히 적는 것은 에이전트의 성능을 저하시키고 토큰 비용을 20% 증가시키므로, 에이전트가 스스로 파악하기 어려운 개인적 선호도 위주로 작성해야 한다.

구글이 발표한 Stitch는 Gemini 기반의 UI 디자인 파트너로, AI 네이티브 캔버스와 디자인 에이전트 기능을 통해 즉각적인 프로토타입 생성과 디자인 시스템 관리를 지원한다.

OpenAI는 Sonnet 4.6 수준의 성능을 갖추면서도 속도는 3배 빠르고 비용은 70% 저렴한 GPT-5.4 mini 모델을 출시하여 효율적인 AI 도입을 가능하게 했다.

MiniMax-M2.7 모델은 자가 진화 기술을 통해 개발되었으며, SWE-bench Pro에서 56.22%의 성능을 기록하며 소프트웨어 엔지니어링 분야에서 최상위권의 역량을 입증했다.

MiniMax-M2.7 모델의 8가지 주요 벤치마크 성능 비교 차트 — ChartSWE-bench Pro(56.2%), MLE-Bench lite(66.6%) 등 다양한 지표에서 M2.7 모델이 기존 M2.5 및 경쟁 모델(Gemini 3.1 Pro, Claude 3.5 Sonnet/Opus, GPT-5.4) 대비 우수한 성능을 보임을 증명한다. 특히 소프트웨어 엔지니어링과 도구 활용 능력에서 높은 점수를 기록하여 실무 적용 가능성을 시사한다.

arXiv용 MCP(Model Context Protocol)와 Cursor의 커뮤니티 플러그인 디렉토리가 공개되어 연구 및 개발 에이전트가 외부 도구와 지식을 더 쉽게 활용할 수 있는 환경이 구축되었다.

실무 Takeaway

AGENTS.md 작성 시 '계획 파일은 항상 특정 경로에 작성'과 같이 에이전트의 행동을 직접적으로 교정하는 지침을 조건부 블록으로 제공하여 작업의 일관성을 확보해야 한다.
고성능이 필요하면서도 비용과 속도가 중요한 서비스라면 Sonnet 4.6급 지능에 70% 저렴한 GPT-5.4 mini를 우선적으로 고려하여 인프라 효율을 극대화할 수 있다.