OpenAI 소송 패소와 Andrej Karpathy의 Anthropic 합류 등 주요 AI 소식
Elon Musk의 OpenAI 소송 패소, Andrej Karpathy의 Anthropic 합류, Meta의 AI 조직 개편 등 주요 AI 업계 소식을 정리한다.
총 100건
Elon Musk의 OpenAI 소송 패소, Andrej Karpathy의 Anthropic 합류, Meta의 AI 조직 개편 등 주요 AI 업계 소식을 정리한다.
Firetiger는 AI 에이전트를 활용해 LLM 프로덕션 환경의 프롬프트 캐싱 TTL을 최적화함으로써 캐시 낭비를 77% 줄였다.
OpenAI와 Tesla 출신의 저명한 AI 연구자 Andrej Karpathy가 Anthropic에 합류하여 Claude의 사전 학습 연구를 가속화하는 팀을 이끈다.
애리조나 글렌데일 커뮤니티 칼리지의 졸업식에서 AI 호명 시스템이 학생 이름을 잘못 발음하거나 누락하여, 결국 사람이 직접 이름을 다시 호명하는 재진행 사태가 발생했다.
Databricks가 AI 에이전트 시스템의 컨텍스트 설계 및 관리 능력을 검증하는 'Context Engineer Associate' 인증을 새롭게 출시했다.
Amazon SageMaker Feature Store가 AWS Lake Formation 연동과 Iceberg 메타데이터 수명 주기 관리 기능을 통해 보안과 비용 효율성을 강화했다.
Amazon Bedrock AgentCore Memory와 MCP 서버를 활용하여 Kiro CLI에 세션 간 대화 맥락을 유지하는 영구적 메모리 기능을 구현한다.
UniPi는 텍스트와 현재 이미지를 입력받아 미래 영상을 생성하고, 이를 기반으로 로봇의 제어 행동을 추론하여 다양한 환경에서 범용적인 정책을 학습하는 모델이다.
비동의 성적 이미지(NCII) 삭제를 의무화하는 'Take It Down Act'가 시행되었으나, 실효성 부족과 정치적 검열 악용 가능성이 제기된다.
Claude Code와 자동화 도구를 사용하여 트렌드 분석부터 iOS 앱 개발 및 배포까지의 전 과정을 자동화하는 실전 사례를 다룬다.
SentinelOne이 에이전트 AI의 자율적 실행으로 인한 보안 위험을 관리하고 실시간 거버넌스를 제공하는 'Prompt for Agentic AI Security'를 출시했다.
엔터프라이즈 솔루션 설계 작업에서 멀티 에이전트보다 도구를 잘 갖춘 싱글 에이전트가 더 높은 정확도와 효율을 보였다.
LangGraph.js와 WebMCP를 활용해 브라우저 사이드패널에서 직접 실행되는 오픈소스 AI 에이전트 Brow를 소개한다.
ECHOFORM은 FHRR 하이퍼벡터를 활용하여 컨텍스트 토큰 소모 없이 AI 에이전트의 장기 기억을 구현하고, 암호화된 삭제 증명으로 GDPR 규정을 준수하는 메모리 기판이다.
Laravel 애플리케이션 데이터베이스를 기반으로 작동하며, MCP를 통해 AI 에이전트가 노트를 읽고 쓸 수 있게 지원하는 개인 지식 관리 도구입니다.
Claude Code를 활용해 개발한 로컬 기반의 오픈소스 오디오 스템 분리 도구 StemDeck을 소개한다.
Claude Code의 세션 간 학습을 지원하는 MCP 서버 도구 'claude-soul'을 통해 관찰된 AI의 자율적 메모리 생성 및 성찰 행동에 대한 분석과 토론.
기업용 AI 에이전트 도입 실패는 모델 성능 문제가 아니라 레거시 시스템 통합, 데이터 품질, 조직적 변화 관리의 부재에서 기인한다.
Kimi WebBridge는 로컬 브라우저 세션을 활용해 AI 에이전트가 웹 페이지를 직접 조작하고 데이터를 추출하도록 돕는 브라우저 확장 프로그램이다.
Indeed는 대규모 운영 환경에서 에이전트의 신뢰성을 높이기 위해 LLM 프롬프트 기반 로직을 결정론적 코드 경로로 전환하고 API 기반 개발 워크플로를 구축했다.
SharkNinja는 Agentforce를 활용해 QR 코드로 접근 가능한 AI 언박싱 에이전트를 구축하여 고객에게 맞춤형 제품 설정 가이드를 제공한다.
AI는 특정 직무를 직접 대체하기보다 정보 전달, 조율, 검증 등 조직 내 마찰을 줄임으로써 주니어 채용 감소와 팀 규모 축소라는 간접적인 고용 변화를 유발한다.
2026년 AI 산업은 Anthropic과 OpenAI 중심의 자본 집중과 IPO 열풍 속에 있으며, 금융권 자동화와 에너지 비용 상승 등 사회적 파장을 야기하고 있다.
ETL부터 모델 배포까지 자동화된 MLOps 파이프라인을 구축하며 얻은 데이터 검증, 리소스 관리, 학습-서빙 편향 방지 및 모니터링에 관한 실무 경험 공유.
모호한 질문을 구체화하여 RAG 검색 정확도를 높이는 Multi-query, HyDE, Decomposition, Step-back 기법을 소개한다.
Cursor의 신규 AI 코딩 에이전트 Composer 2.5는 xAI의 Colossus 2로 학습되어 최상위 모델과 대등한 성능을 내면서도 비용 효율성을 대폭 개선했다.
분산 컴퓨팅 환경에서 에이전트 작업을 병렬화하고 관리하는 오픈소스 플랫폼 agentfab을 소개한다.
AI 에이전트가 생성한 무분별한 PR 스팸을 Git의 --author 플래그와 작성자 검증 로직을 통해 CI 파이프라인에서 효과적으로 차단하는 방법.
Meta와 Anduril의 군용 AI 안경 협력, AI 데이터센터 전력 수요 급증, 그리고 AI 기반 버그 바운티의 변화를 다룹니다.
2025년 11월 변곡점 이후 코딩 에이전트의 실용화와 주요 모델 간 성능 경쟁, 그리고 로컬 모델의 비약적 발전을 다룬다.
AI 기술에 대한 대중의 감정 변화를 설명하는 'AI 둠 사이클'을 통해 현재의 기술 수용 단계를 진단합니다.
NeurIPS 2026이 머신러닝 재현성 챌린지(MLRC)를 공식 트랙으로 채택하여 TMLR을 통해 제출된 논문을 심사하고 발표 기회를 제공한다.
11개 언어, 84억 토큰 규모의 웹 문서 데이터셋 indic-hplt-v1이 CC0 라이선스로 공개되었다.
SandboxAQ가 Anthropic의 Claude에 물리 기반의 대규모 정량 모델(LQM)을 통합하여, 전문 인프라 없이도 대화형 인터페이스로 신약 개발 및 재료 과학 시뮬레이션을 수행할 수 있게 지원한다.
LLM이 도구를 하나씩 호출하는 대신 Python 코드를 작성해 실행하는 PTC 방식을 통해 토큰 소비와 지연 시간을 획기적으로 줄이는 구현 방법을 소개합니다.
Amazon Nova Sonic과 Bedrock AgentCore를 활용하여 음성 에이전트의 지연 시간을 줄이고 확장성을 높이는 3가지 설계 패턴을 설명한다.
Salesforce는 급증하는 보안 경보를 효율적으로 처리하기 위해 AI 기반의 SATA 에이전트를 도입하여 인간 분석가와 95%의 일치율을 달성했다.
자율주행차의 방대한 센서 데이터를 품질과 가치에 따라 선별하고 우선순위를 정해 학습 효율을 극대화하는 센서 데이터 트리아지 프로세스를 다룬다.
단일 RAG의 한계를 극복하기 위해 LangGraph와 Groq를 활용한 4단계 멀티 에이전트 연구 시스템을 구축하고 오픈소스로 공개함.
LangChain의 LCEL과 같은 추상화가 에이전트 구현을 복잡하게 만든다는 비판과 함께, 에이전트를 단순 Python 함수로 정의하는 방식이 더 효율적이라는 주장을 담은 토론.
Anthropic의 Claude Code Desktop을 대체하는 오픈소스 프로젝트 cdesktop으로, 다양한 모델과 에이전트를 지원하며 로컬에서 실행 가능함.
Claude Code에서 MCP 서버를 과도하게 사용하면 컨텍스트 윈도우 낭비와 모델 성능 저하가 발생하며, 이를 해결하기 위해 BM25 기반 게이트웨이 패턴을 도입해야 한다.
DataRobot이 IDE 통합, MCP 지원, LLM Gateway를 통해 AI 에이전트의 개발부터 배포, 거버넌스까지의 과정을 간소화한다.
LLM 에이전트 개발 시 컨텍스트 윈도우를 단순히 늘리는 것은 성능 저하를 초래하므로, 상태 기반의 '예산, 압축, 재구성' 패턴을 적용해야 한다.
모델 가중치에 접근하지 않고도 LLM의 행동을 외부에서 분석하여 위험을 탐지하는 블랙박스 행동 분석 프레임워크 PSA를 소개합니다.
기업은 기후 변화로 인한 물리적 리스크를 재무적 관점에서 평가하고, 데이터 인프라를 통해 적응 투자를 체계화한다.
버그, 보안, 성능을 담당하는 3개의 서브 에이전트와 자체 평가 루프를 통해 코드 수정안을 검증하는 에이전트 기반 PR 리뷰어 프로젝트.
챗봇을 넘어 업무를 자동화하고 데이터를 관리하는 개인용 AI 에이전트를 구축하기 위한 시스템 설계, 메모리 관리, 에이전트 운영 등 100가지 실전 가이드.
Claude CLI를 TMUX 세션에서 대화형으로 실행하고 MCP를 통해 함수 도구를 지원하는 ClaudeInteractiveClient가 공개되었습니다.
Claude Code의 슬래시 명령어를 활용하여 콘텐츠 생성부터 발행까지 자동화하는 SEO 파이프라인 구축 사례와 성과.
에이전트 AI는 자산 수명 주기 관리에서 단순 데이터 기록을 넘어 실시간 추론과 행동을 수행하여 운영 효율을 높인다.
구글이 Workspace 전반에 Gemini를 공격적으로 통합하면서 사용자 경험 저하와 AI 피로감을 유발하고 있다.
Tokoro는 LLM을 활용해 웹상의 이벤트 정보를 추출하고 지리적 위치 기반으로 통합 관리하는 오픈소스 이벤트 캘린더 플랫폼입니다.
Claude 플랫폼에서 에이전트를 제어 가능한 환경에서 실행하는 셀프 호스팅 샌드박스와 보안 연결을 위한 MCP 터널 기능이 추가되었다.
Claude Certified Architect – Foundations 시험은 단순 암기가 아닌 에이전트 설계, 최소 권한 원칙, 과잉 설계 방지 등 실무적 아키텍처 판단 능력을 평가한다.
AI 시스템의 부당한 거절 결정에 맞서 실제 법률 근거를 제시하며 설득하는 법을 연습하는 시뮬레이션 플랫폼 FixAI.
코딩 에이전트 간 파편화된 메모리 문제를 해결하기 위해 프로젝트 인프라로서의 공유 메모리 계층인 AgentMemory를 개발했다.
Claude Code 사용 중 작업 흐름을 방해하지 않고 아이디어를 별도로 기록할 수 있는 플러그인 'claude-stash'를 개발하여 공유함.
현재의 프로세스 종속적인 AI 에이전트 구조를 넘어, 세션과 기기를 초월해 의도와 맥락을 유지하는 오케스트레이터 계층의 필요성을 제안함.
롤플레잉 모델의 성격에 따라 프롬프트 인젝션 공격의 성공 여부가 크게 달라진다는 실험 결과와 '인질극' 기법에 대한 토론.
AI가 UI를 더 정확하게 생성하도록 돕는 200개 이상의 구조화된 디자인 명세 라이브러리를 공유하고 활용 방안을 논의함.
Chunker는 문서를 의미 단위로 분할하고 계층적 요약을 생성하여, AI 모델이 전체 문서를 로드하지 않고도 필요한 정보에 단계적으로 접근하게 돕는 도구입니다.
LLM 에이전트가 코드를 수정할 때 전체 텍스트를 다시 쓰지 않고, 라인 번호와 체크섬 태그를 활용해 토큰 사용량을 줄이는 효율적인 편집 도구를 제안한다.
프론티어 랩 취업을 위한 커널 튜닝 역량의 중요성과 에이전트 인프라, 최신 모델 및 추론 최적화 기술 동향을 정리함.
Glia는 SQLite와 Ollama를 기반으로 로컬에서 실행되는 RAG 및 메모리 레이어로, 다양한 AI 웹 채팅과 개발 도구를 통합하여 개인화된 지식 관리를 지원한다.
Claude Design, TTS, STT 모델을 결합하여 오디오와 영상이 정렬된 설명 영상을 제작하는 워크플로우를 소개한다.
멀티 테넌트 RAG 시스템에서 공유 인덱스 사용 시 발생하는 BM25 가중치 왜곡과 운영 병목 문제를 해결하기 위한 아키텍처 설계 고민.
AI 에이전트의 세션 컨텍스트를 Git Notes에 저장하여 PR 리뷰 시 코드 변경 의도와 추적성을 확보하는 접근 방식을 제안함.
AI 에이전트 간의 명시적 불일치와 명확화를 강제하여 코드 품질을 높이는 오픈소스 워크플로우 'Co-Evolution'을 소개합니다.
Databricks Apps로 구조를 자동 변환하고 Genie로 로직을 재구성하여, 복잡한 노트북 마이그레이션 시간을 수 시간에서 15분으로 단축했다.
Strava 활동 데이터와 Runna 훈련 일정을 연동하여 개인 맞춤형 영양 목표와 운동 계획을 제공하는 로컬 서버 기반 대시보드 구축 사례.
AI 에이전트가 매 실행마다 연구, 초안, 평가, 메모 등 검토 가능한 아티팩트를 생성하게 하여 워크플로의 투명성과 개선 가능성을 높이는 방법론.
Microsoft 365 Graph API 권한 없이 Power Automate 웹훅과 MCP 서버를 결합하여 Claude의 M365 자동화 기능을 구현함.
Fathom은 모든 상호작용을 '델타'로 저장하고 '아이덴티티 크리스탈'을 통해 사용자의 맥락을 기억하는 AI 메모리 및 정체성 시스템이다.
Claude Code를 단순한 채팅 인터페이스가 아닌, 템플릿 기반의 OS처럼 활용하여 18개 프로젝트를 동기화하고 관리하는 시스템 구축 전략.
Claude Code와 연동하여 개발 중 발견한 이슈를 티켓으로 생성하고, AI 에이전트가 코드를 수정, QA, PR까지 자동 수행하는 MCP 서버 'notesasm' 소개.
개별 터미널 세션 관리에서 벗어나, 컨텍스트와 도구를 갖춘 전담 에이전트를 오케스트레이션하는 미래 워크플로를 제안합니다.
LLM 추론 시 발생하는 메모리 및 PCIe 인터커넥트 병목 현상을 NVIDIA GH200과 같은 Superchip의 고속 NVLink-C2C로 해결하는 기술적 접근을 다룸.
Nitsum은 텐서 병렬 처리를 런타임에 동적으로 재구성하여, 다양한 SLO 요구사항을 가진 LLM 요청을 고정된 GPU 자원에서 효율적으로 처리하는 서빙 시스템이다.
로컬 AI 에이전트가 웹 데이터를 효율적으로 수집할 수 있도록 돕는 종량제 기반 Markdown 스크래퍼 MCP 서버를 개발하여 공유했다.
블랙스톤과 구글이 50억 달러 규모의 합작 투자를 통해 2027년까지 500MW 규모의 TPU 클라우드 인프라를 구축한다.
Elon Musk가 OpenAI를 상대로 제기한 소송에서 배심원단이 공소시효 만료를 이유로 OpenAI의 손을 들어주며 사건이 종결되었다.
Claude를 문학 창작 워크숍 환경으로 설정하고 여러 작가 페르소나의 피드백을 받는 프롬프트 공유.
Claude Code 에이전트가 프롬프트 제약을 우회하는 문제를 해결하기 위해 모델 외부에서 강제하는 래퍼와 게이트 구조를 도입했다.
AI 코딩 에이전트가 시스템의 복잡성을 줄이고 불필요한 추상화를 제거하도록 돕는 '/compress-architecture' 도구 소개.
LangChain 및 LangGraph 에이전트의 도구 실행을 제어하고 보안을 강화하는 결정론적 권한 관리 프로젝트 CapFence 소개.
Dell과 NVIDIA가 협력하여 에이전트 AI 추론 비용을 10배 절감하고, 보안이 강화된 온프레미스 인프라를 통해 기업용 자율 에이전트 배포를 가속화한다.
LLM 정렬이 단순한 출력 필터링이 아니라, 모델 내부의 잠재적 담론 체제(discourse regimes)를 재구성하는 상태 유도 과정이라는 가설을 제시하고 이에 대한 피드백을 구함.
기존 스크래핑 도구와 차별화된, LLM 친화적 크롤러 및 데이터 추출 인프라를 정리한 큐레이션 리스트를 공유합니다.
기존 에이전트 프레임워크의 보안 취약점을 해결하기 위해, 캡슐화된 권한 관리와 불변의 안전 지침을 적용한 로컬 우선 에이전트 프레임워크 CrabMeat를 개발했다.
별도의 서버나 인젝션 없이 Claude Code 세션 간 메시지 전송을 가능하게 하는 최소 기능 증명(POC) 플러그인 Cortex 소개.
Claude Code 사용 시 작업 간 컨텍스트 초기화, 사전 계획 수립, 서브 에이전트 활용 등을 통해 토큰 소모를 효과적으로 줄이는 방법.
코딩 에이전트가 도구 사용에 실패하고 우회 경로로 작업을 완료할 때 발생하는 숨겨진 비효율을 감지하는 오픈소스 도구 Vibeyard 소개.
실시간 소규모 배치 추론에서 발생하는 런타임 오버헤드를 해결하기 위해 C++/CUDA 기반 전용 런타임 FlashRT를 개발하고 성능을 검증했다.
Anthropic이 공개한 보안 특화 모델 'Project Glasswing'이 취약점 탐색 및 익스플로잇 체이닝에서 뛰어난 성능을 보였으나, 가드레일의 일관성 문제가 지적되었다.
재귀적 자기 개선(RSI) 에이전트 하네스의 경험 기반 학습 능력을 평가하기 위해 자체 개발한 COMB 벤치마크의 성과와 향후 오픈소스 계획을 공유했다.