Claude Cowork Dispatch 공개 및 GPT-5.4 mini 출시 등 최신 AI 기술 동향

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

Anthropic은 사용자의 컴퓨터에서 실행되는 Claude와 모바일로 소통하며 원격 작업을 수행하는 'Dispatch' 기능을 연구 프리뷰로 공개했다. OpenAI는 코딩과 서브에이전트 활용에 최적화된 GPT-5.4 mini 및 nano 모델을 출시하여 추론 효율성을 강조했다. 아키텍처 분야에서는 레이어 간 메모리를 활용하는 'Vertical Attention' 연구와 추론 효율을 극대화한 Mamba-3 하이브리드 모델이 주목받고 있다. 이외에도 Unsloth Studio의 로컬 학습 도구 출시와 NVIDIA GTC에서의 에이전트 중심 전략이 주요 소식으로 포함되었다.

배경

LLM 에이전트 개념, Transformer 아키텍처 기초, MoE(Mixture of Experts) 구조 이해

대상 독자

AI 에이전트 개발자 및 LLM 연구자

의미 / 영향

에이전트 실행 인프라의 표준화와 소형 모델의 고성능화가 가속화되어 실질적인 업무 자동화 도구의 보급이 빨라질 것으로 예상된다.

섹션별 상세

Anthropic은 Claude Desktop과 모바일을 연동하여 원격으로 작업을 지시하고 결과를 확인할 수 있는 'Claude Cowork Dispatch' 기능을 연구 프리뷰로 출시했다.

Claude Cowork Dispatch 기능의 모바일 인터페이스 스크린샷이다. — Screenshot사용자가 모바일 앱을 통해 데스크톱에서 실행 중인 Claude에게 특정 파일을 열고 요약해달라고 요청하는 실제 사용 시나리오를 보여준다. 이는 Anthropic이 지향하는 원격 제어 및 에이전트 협업의 구체적인 UI/UX 방향성을 제시한다.

OpenAI는 기존 모델보다 2배 빠르고 400k 컨텍스트 창을 지원하는 GPT-5.4 mini와 nano 모델을 공개하며 코딩 및 컴퓨터 사용 에이전트 시장 공략을 강화했다.

아키텍처 연구에서는 레이어 간 상태를 쿼리하여 메모리를 확장하는 'Attention Residuals(Vertical Attention)'와 추론 효율을 높인 'Mamba-3' 하이브리드 모델이 발표되었다.

LangChain은 안전한 코드 실행을 위한 'LangSmith Sandboxes'와 오픈소스 코딩 에이전트 'Open SWE'를 공개하며 에이전트 인프라 생태계를 확장했다.

Unsloth는 VRAM 사용량을 70% 줄이고 학습 속도를 2배 높인 로컬 모델 학습 및 추론용 웹 UI인 'Unsloth Studio'를 오픈소스로 출시했다.

bash

pip install unsloth

로컬 모델 학습 및 추론을 위한 Unsloth Studio 설치 명령어

Mistral AI는 1,190억 개의 파라미터를 가진 MoE 모델 'Mistral Small 4'를 공개했으며 256k 컨텍스트와 멀티모달 입력을 지원한다.

실무 Takeaway

에이전트 워크플로우를 위해 GPT-5.4 mini와 같은 소형 모델의 코딩 성능과 추론 속도가 핵심 경쟁력으로 부상하고 있다.
단순한 챗봇을 넘어 보안 샌드박스와 파일 시스템 추상화를 포함한 에이전트 하네스 인프라 구축이 제품화의 필수 요소가 되고 있다.
Vertical Attention이나 Mamba-3와 같은 새로운 아키텍처 시도는 Transformer의 병목 현상을 해결하고 추론 효율성을 극대화하는 방향으로 진화 중이다.

언급된 리소스

문서Unsloth Documentation

DemoMistral Small 4 on Hugging Face