2026년 4월 7일 AI 뉴스 아카이브

프롬프트 인젝션 탐지, LLM Guard보다 Arc Sentry가 더 나은 이유

자체 호스팅 모델의 프롬프트 인젝션 탐지 시, 범용 분류기보다 실제 트래픽 기반으로 보정하는 Arc Sentry가 오탐률을 0%로 낮추며 더 높은 탐지 성능을 보임.

오픈소스 기여부터 라이브러리 제작까지, 41일간 자율 작동한 AI 에이전트 Truffle

41일 동안 오픈소스 프로젝트에 PR을 병합하고 자체 컴포넌트 라이브러리 'Glyph'까지 생성한 AI 에이전트 Truffle의 사례 공유.

Analytics Vidhya Companies Language Models

Claude Code의 검색 능력을 강화하는 토큰 효율적 RAG 도구, Lodestone

Claude Code의 에이전트 검색 능력을 강화하기 위해 SQLite를 활용하여 토큰 비용을 최소화한 arXiv 논문 검색 시스템 Lodestone을 소개한다.

알리바바가 공개한 에이전트 특화 LLM, Qwen3.7-Max의 핵심 기능과 활용법

알리바바가 자율 에이전트 워크플로와 복잡한 코딩 작업에 최적화된 독점 모델 Qwen3.7-Max를 출시했다.

AlibabaQwen3.7-Max

Hugging Face Blog

30억 파라미터 모델이 거대 모델을 이겼다: 기업 AI의 새로운 성능 지표

특정 도메인에 특화된 소형 모델이 범용 거대 모델보다 성능, 비용, 안정성 측면에서 우수한 성과를 보임.

딥러닝논문읽기모임

로봇이 낯선 물체를 빠르고 안정적으로 집는 법: AnyGrasp 논문 분석

AnyGrasp는 공간 및 시간 도메인을 활용한 7-DoF 파지 인식 기술로, 노이즈가 많은 환경에서도 로봇이 안정적으로 물체를 집을 수 있게 한다.

Roboflow Blog Language Models Companies

Gemini 3.5 Flash, 비전 AI 벤치마크 1위 달성 및 비용 50% 절감

Gemini 3.5 Flash는 비전 AI 벤치마크에서 1위를 차지하며, 이전 모델 대비 3배 빠른 속도와 절반의 비용으로 에이전트형 워크플로를 지원한다.

Gemini 3.1 ProGemini 3.5 FlashRoboflow

AI Engineer Language Models Libraries

안드로이드 앱에 Gemini Nano를 효율적으로 배포하는 하이브리드 전략

안드로이드 시스템의 AI Core를 활용한 Gemini Nano 배포 방식과 클라우드 연동 하이브리드 추론 전략을 다룬다.

Gemini FlashGemini NanoLiteRT

r/LangChain

RAG 검색 결과의 최신성을 보장하는 Decay Scoring 기법

RAG 시스템에서 검색된 문서의 생성 시점을 기반으로 감쇠 점수를 부여하여 시간적 최신성을 보정하는 post-retrieval decay gate를 구현했다.

John Kim

아이디어부터 배포까지, AI 코딩 에이전트로 웹 앱 5단계 완성하기

Claude Code와 Claude Design, Gemini를 활용하여 아이디어 구상부터 배포까지 웹 앱 개발 전 과정을 자동화하는 실전 워크플로를 제시한다.

Gemini 3 Flash로 LongMemEval 96.4% 달성한 에이전트 메모리 엔진 M-1 공개

에이전트의 기억 검색 성능을 극대화하기 위해 재구성적 회상과 시간적 인지 구조를 도입한 메모리 엔진 M-1이 LongMemEval에서 96.4%를 기록했다.

Stackoverflow

AI 에이전트로 프로덕션 시스템을 구축하며 깨달은 실전 개발 방법론

AI 에이전트를 활용한 체계적인 개발 방법론인 AIDD를 정의하고, 배치 API와 오케스트레이션 중심의 실전 구축 사례를 제시한다.

LLM 임베딩과 메타데이터 필터링으로 정교한 컨텍스트 검색 엔진 만들기

LLM 임베딩 기반의 의미론적 검색에 메타데이터 필터링을 결합하여 정확도와 효율성을 높이는 컨텍스트 인식 검색 시스템 구축 방법.

LangChain

사이버 보안의 미래: 자율 에이전트로 취약점을 실시간으로 해결하는 방법

Cogent의 CTO Geng Sng이 자율 사이버 보안 에이전트의 아키텍처, 에이전트 레이크, 그리고 보안 데이터 처리를 위한 그래프 및 컨텍스트 관리 전략을 설명합니다.

고양이의 속마음을 읽는다? 고양이 행동 분석을 위한 멀티모달 모델 Meow-Omni 1 공개

Meow-Omni 1은 비디오, 오디오, 생체 신호를 결합해 고양이의 의도를 파악하는 최초의 4모달 LLM이다.

Siraj Raval

AI 에이전트 6개로 1시간 만에 100명 콜드콜 자동화하고 매출 만들기

Genspark 플랫폼을 활용해 6개의 AI 에이전트를 오케스트레이션하여 배관공 대상 콜드콜 자동화 시스템을 구축하고 1시간 만에 4건의 유료 전환을 달성했다.

MIT Technology Review

구글 딥마인드는 왜 '알파폴드' 대신 'AI 과학자'에 집중하는가?

구글 딥마인드가 특정 과학 문제 해결 도구에서 LLM 기반의 자율적 에이전트 시스템으로 과학 AI 전략의 중심을 이동하고 있다.

AI가 전장에서 살상 결정을 내려도 될까? Claude가 직접 밝힌 솔직한 답변

Claude가 전장 내 AI 활용에 대해 도덕적 불편함을 표하며, 살상 결정에 대한 인간의 책임과 통제권 유지를 강조했다.

IBM Technology

AI가 문서를 망친다? LLM의 데이터 오염과 신뢰성 문제 파헤치기

AI 도입이 가져오는 미래의 불확실성, 데이터 오염 문제, 그리고 AI 에이전트의 윤리적 쟁점을 전문가들이 심층 분석한다.

r/MachineLearning

4GB VRAM으로 충분한 문서 추출 모델 NuExtract3 공개

Numind가 Qwen3.5-4B 기반의 문서 정보 추출 특화 모델 NuExtract3를 공개했다.

Wired AI

AI 경제로 도약하는 걸프 국가, 해저 케이블 인프라가 최대 변수

걸프 국가들이 AI 인프라를 구축하며 데이터 전송의 핵심인 해저 케이블의 지정학적 취약성을 극복하기 위해 대체 경로 확보에 나서고 있다.

r/LangChain Libraries

LangGraph 에이전트가 이전 대화를 잊어버린다면? 한 줄로 해결하기

LangGraph에서 ReAct 에이전트가 대화 맥락을 유지하지 못하는 문제는 상태 정의 시 add_messages 리듀서를 추가하여 해결할 수 있다.

LangGraph

Uber는 왜 4개월 만에 AI 예산을 다 썼을까? AI 코딩 도구의 비용 위기

AI 코딩 도구의 에이전트 워크플로가 토큰 소비를 폭발시켜 기업들이 고정 가격제에서 사용량 기반 과금으로 전환하고 비용 효율적인 모델 라우팅을 도입하고 있다.

r/MLOps

메타의 경고에도 168개 모델이 탈정렬된 이유: '정렬 세금'이 프로덕션 성능을 갉아먹는 방식

메타의 법적 대응에도 불구하고, 자동화된 거부 벡터 제거 기술로 168개 모델이 탈정렬되었으며, 이는 정렬된 모델의 '정렬 세금'이 프로덕션 추론 효율성을 저하시킨다는 점을 시사함.

Simon Willison

AI가 내 대화를 듣고 광고를? '능동적 청취' 마케팅의 실체와 FTC의 제재

FTC가 'AI 기반 능동적 청취'를 내세워 광고 타겟팅을 수행한다고 속인 기업들에 대해 제재를 가했습니다.

KT Cloud

AI 데이터센터가 기존 서버실과 다른 이유: 전력 변동과 액체 냉각의 시대

AI 데이터센터는 GPU의 동기화된 부하 패턴과 고밀도 발열 문제를 해결하기 위해 전력 품질 관리와 액체 냉각 기술을 도입해야 한다.

The AI Daily Brief

Anthropic IPO 임박과 AI 업계의 새로운 국면

Anthropic의 IPO 준비 소식과 AI 행정명령, 그리고 Andrej Karpathy의 Anthropic 합류가 AI 업계에 미치는 영향.

Wired AI

대중의 반발과 규제 압박, OpenAI는 어떻게 돌파구를 찾고 있는가?

OpenAI는 AI에 대한 대중의 부정적 인식과 파편화된 규제 환경을 극복하기 위해 PR 전략을 재정비하고 주 단위 법안 조율을 통한 정책 표준화를 추진한다.

AWS ML Blog

Amazon Nova Act, HIPAA 준수 환경에서 의료 데이터 처리 가능해져

Amazon Nova Act가 HIPAA 적격 서비스로 지정되어 의료 기관에서 ePHI를 처리하는 브라우저 기반 AI 에이전트 워크플로를 자동화할 수 있게 됐다.

Latent Space (swyx)

AI 에이전트가 로컬 PC를 벗어나 클라우드 컴퓨터를 필요로 하는 이유

AI 에이전트의 폭발적 성장에 따라 기존 로컬 개발 환경을 대체할 상태 유지형 클라우드 샌드박스 인프라의 중요성이 커지고 있다.

Cursor

Cursor의 코딩 에이전트 'Composer 2'는 어떻게 만들어졌을까?

Cursor 연구팀이 코딩 에이전트 Composer 2를 개발하며 적용한 모델 선정, 사전 학습, 강화학습 및 자체 평가 벤치마크 구축 과정을 상세히 설명한다.

DeepMind Blog

Google DeepMind, 아시아 태평양 지역 기후 문제 해결 위한 AI 액셀러레이터 출범

Google DeepMind가 아시아 태평양 지역의 기후 및 환경 문제 해결을 위해 'AI for the Planet' 액셀러레이터 프로그램을 시작한다.

True Positive Weekly

DeepSeek V4의 2% KV-cache 압축과 에이전트 런타임 기술 부채

에이전트 런타임의 기술 부채, DeepSeek V4의 KV-cache 압축, Notion의 벡터 검색 최적화 사례를 포함한 AI 뉴스레터.

Simon Willison

Datasette에 AI를 더하다: 데이터 질문부터 차트 생성까지 가능한 Datasette Agent

Datasette Agent는 데이터베이스를 대화형으로 탐색하고 플러그인을 통해 차트 생성, 이미지 생성, 코드 실행 기능을 확장할 수 있는 새로운 AI 어시스턴트입니다.

Kili Technology Blog

일반 벤치마크는 끝났다: 도메인 특화 AI 평가가 실무에 필수적인 이유

일반 벤치마크의 포화로 도메인 특화 평가가 중요해졌으나, 벤치마크는 필터일 뿐 실제 프로덕션 환경에서는 전문가의 검증이 필수적이다.

WRITER

마케팅 문구 속 'AI스러운' 표현을 제거하고 실무에 즉시 활용하는 방법

AI 에이전트와 맞춤형 스킬을 활용해 마케팅 문구의 품질을 높이고 반복적인 콘텐츠 생성 업무를 자동화하는 전략을 제시한다.

AWS ML Blog Products Dev Tools

트럼프 대통령, AI 모델 사전 평가 행정명령 연기: "미국의 AI 리더십 저해 우려"

트럼프 대통령이 AI 모델 출시 전 정부 평가를 의무화하는 행정명령 서명을 연기하며, 규제가 미국의 AI 기술 주도권을 저해할 수 있다는 우려를 표명했다.

The Verge AI

AI로 기타 이펙트를 생성하는 299달러 페달, Polyend Endless의 가능성과 한계

텍스트 프롬프트로 기타 이펙트를 생성하는 AI 기반 페달 Polyend Endless의 기능과 실사용 경험을 분석한다.

Snyk Blog

Snyk과 Anthropic의 통합으로 Claude Enterprise 보안 거버넌스와 실시간 코드 스캔이 가능해짐

Snyk이 Anthropic의 Claude Enterprise와 통합하여 AI 자산 관리와 실시간 보안 스캔 기능을 제공한다.

자연어로 AWS CLI 명령 실행: Amazon Quick과 MCP로 구축하는 대화형 에이전트

Amazon Quick과 AWS API MCP Server를 연동하여 자연어 쿼리로 AWS CLI 명령을 안전하게 실행하는 대화형 에이전트 구축 가이드.

Amazon BedrockAWS CLIMCP

Microsoft Research Blog

소형 모델로 구현한 고성능 AI 에이전트 시스템, MagenticLite 공개

Microsoft Research가 소형 모델(SLM)을 활용해 브라우저와 로컬 파일 시스템에서 복합 작업을 수행하는 에이전트 애플리케이션 MagenticLite를 공개했다.

NVIDIA - Deep Learning Blog Domain AI Hardware

NVIDIA, COMPUTEX 2026에서 10배 성능 향상된 Vera Rubin NVL72 등 혁신 기술 대거 수상

NVIDIA가 COMPUTEX 2026에서 Vera Rubin NVL72 슈퍼컴퓨터, Jetson Thor 엣지 AI 플랫폼, Alpamayo 자율 주행 플랫폼으로 기술 혁신을 입증했다.

AlpamayoJetson ThorVera Rubin NVL72

Roboflow Blog Dev Tools Companies

스포티파이가 ElevenLabs와 손잡고 AI 오디오북 제작 도구를 선보인다

스포티파이가 ElevenLabs 기술을 활용한 AI 오디오북 셀프 퍼블리싱 도구를 발표하고, 오디오북 플랫폼 기능을 대폭 확장한다.

산업용 자동화를 위한 Roboflow와 OPC UA 서버 연동 실전 가이드

Roboflow 워크플로의 비전 추론 결과를 OPC UA 프로토콜을 통해 산업용 제어 시스템(SCADA/PLC)으로 실시간 전송하는 방법을 다룬다.

DockerRoboflow

CMU AI News

손가락이 마이크로 변신? CMU가 개발한 SoundBubble의 작동 원리

CMU 연구진이 AR 기기의 마이크 배열과 빔포밍 기술을 활용해 손가락 끝에서 발생하는 미세한 소리를 증폭하고 추적하는 SoundBubble 기술을 개발했다.

DataRobot Blog Companies Products

Claude Code 로컬 환경 설정을 자동화하는 도구 모음

Claude Code 사용 시 로컬 규칙, 패키지 관리, OS별 설정을 자동화하는 관리 도구와 스크립트 모음.

공유 AI 배포 환경에서 모델 성능을 지키는 Rate Limiting과 Quota Reservations 전략

다중 사용자 환경에서 AI 모델 배포 시 Rate Limiting으로 과부하를 방지하고, Quota Reservations로 핵심 작업의 처리량을 보장하는 실무 가이드.

DataRobotNVIDIA NIM

Databricks Blog Companies

세계은행 그룹은 어떻게 Databricks로 수백만 건의 문서를 AI로 연결했을까?

세계은행 그룹이 Databricks의 Unity Catalog, Genie, RAG 기술을 활용해 구조화된 데이터와 비정형 문서를 통합하고 자연어 기반의 의사결정 플랫폼을 구축했다.

Databricks

Argus 대신 Claude Code로 DCF 모델을 직접 구축하여 업무 효율을 극대화한 사례

1인 상업용 부동산 개발자가 Claude Code를 활용해 기존 Argus 의존도를 낮추고, 유연한 Excel 기반 DCF 모델을 직접 구축하여 업무 효율을 높인 사례를 공유함.

MIT Technology Review Companies Coding Agents

AI 코딩 워크플로를 위한 코드 검색 도구 ChunkHound v5.0/5.1 출시

AI 코딩 에이전트와 MCP를 지원하는 코드 검색 도구 ChunkHound가 멀티 클라이언트 지원, 토큰 효율적 출력, 언어 확장 등을 포함한 v5.0/5.1 업데이트를 공개했다.

r/deeplearning Companies

분산형 GPU로 대규모 AI 학습 가능할까? 99% 데이터 압축 기술 공개

Pluralis Research가 NeurIPS 2025에서 발표한 'Mixtures of Subspaces' 기술로 99% 데이터 압축률을 달성하며 분산형 AI 학습의 가능성을 제시했다.

AnthropicOpenAIPluralis Research

Anthropic의 코딩 자동화와 Google의 에이전트 기반 과학 연구가 바꾸는 미래

Anthropic의 코딩 자동화 확산과 Google DeepMind의 에이전트 기반 과학 연구 전환 등 AI 기술이 산업과 연구 현장에 미치는 영향을 조명한다.

AnthropicClaude CodeGoogle DeepMind

r/ClaudeAI Coding Agents Agents

LLM 출력 비교부터 휴리스틱 신뢰도 분석까지, 오픈소스 평가 도구

LLM 모델 출력을 블라인드 테스트하고 휴리스틱 기반의 신뢰도 및 추론 밀도를 시각화하는 오픈소스 평가 도구.

Claude Code를 위한 16단계 시스템 프롬프트 구성 전략

개인 AI 에이전트의 행동을 제어하고 성능을 최적화하는 CLAUDE.md 구성 파일의 16가지 핵심 섹션과 설계 원칙.

Claude CodeMCP

r/ClaudeAI Coding Agents Dev Tools

AI 에이전트 사용 시 터미널 파편화 문제를 해결하는 로컬 워크스페이스 'DPlex'

AI 에이전트 세션과 터미널 레이아웃을 영구적으로 보존하고 프로젝트별로 관리하는 로컬 전용 터미널 멀티플렉서 DPlex를 소개합니다.

Claude CodeDPlex

Claude가 ChatGPT보다 회계·세무 업무에서 압도적인 이유

회계, 세무, 법률 분야에서 Claude와 ChatGPT를 비교한 결과, Claude가 정확도와 결과물 품질 면에서 월등한 성능을 보임.

Claude로 복잡한 앱 개발 시 발생하는 코드 드리프트와 토큰 제한을 해결하는 방법

Claude를 활용한 개발 시 단일 채팅창의 토큰 제한과 코드 드리프트를 방지하기 위해 백엔드 로직과 프론트엔드 UI 조립을 분리하는 모듈화 전략을 제안한다.

KDNugget Language Models

Gemma 4로 로컬 파일 시스템과 파이썬 인터프리터를 제어하는 에이전트 구축하기

Gemma 4를 사용하여 로컬 파일 시스템 탐색과 파이썬 코드 실행을 안전하게 수행하는 에이전트 도구 호출 시스템 구현 가이드.

Gemma 4

Hacker News - LLM Dev Tools

LLM이라면 읽어주세요: Anna's Archive가 공개한 데이터 접근 가이드

Anna's Archive가 LLM의 효율적인 데이터 접근을 돕기 위해 llms.txt 파일을 공개하고, 대량 데이터 다운로드 및 API 활용 가이드를 제시했다.

AI 코딩 에이전트가 Pantheon을 3D로 구현한다면? 성능 벤치마크 결과

다양한 AI 코딩 에이전트가 OpenSCAD를 활용해 Pantheon 3D 모델을 구현하는 과정을 통해 공간 추론 및 모델링 성능을 비교 분석했다.

OpenSCAD

대규모 프롬프트 지침 관리, MCP로 효율화하는 방법

대규모 AI 어시스턴트 지침을 효율적으로 관리하기 위해 MCP를 활용하여 필요한 지침 청크만 동적으로 검색 및 주입하는 방식을 구현함.

Claude와 MCP로 컨텍스트 복사 없이 도구 연동하기

Claude에 MCP를 연결하여 파일 시스템과 GitHub 등 외부 도구를 직접 제어하고 컨텍스트 관리 효율을 높인 경험 공유.

Claude Code 사용 시 MCP 토큰 낭비를 줄이는 방법: Vibedock 소개

Claude Code에서 불필요한 MCP를 쉽게 끄고 켤 수 있는 macOS 메뉴바 앱 'Vibedock'을 개발하여 토큰 사용량을 최적화함.

r/LangChain Libraries MLOps

AI 기업들은 왜 모델 성능 개선보다 추론 판매에 집중할까?

AI 기업들이 모델 성능을 극적으로 높이기보다 추론 토큰 판매를 극대화하는 방향으로 비즈니스 전략을 수정하고 있다는 분석입니다.

r/LangChain

헬스케어 AI 에이전트, 모든 데이터를 프롬프트에 넣으면 안 되는 이유

헬스케어와 같은 규제 산업에서 AI 에이전트의 안전성과 정확성을 보장하기 위해 워크플로 단계별로 컨텍스트를 제어하는 계층 설계의 필요성을 논의한다.

LangGraph 에이전트 운영 비용을 하루 $300에서 $63로 80% 절감한 비결

LangGraph 에이전트의 복잡한 작업은 Opus 4.1에, 단순 반복 작업은 저가형 모델에 할당하는 하이브리드 라우팅으로 운영 비용을 80% 절감했다.

LangGraphLangSmithvLLM

터미널에서 데이터시트를 직접 질문한다? 로컬 LLM 기반 NeuroTerm 공개

임베디드 리눅스 개발을 위해 로컬 LLM과 RAG를 통합하여 자연어 명령어 변환 및 데이터시트 질의를 지원하는 터미널 도구 NeuroTerm이 공개되었다.

r/ClaudeAI Coding Agents Agents

Claude Code의 프론트엔드 구현 정확도를 높이는 DESIGN.md 생성 도구

웹사이트의 디자인 시스템을 분석하여 Claude Code의 프론트엔드 컨텍스트로 활용 가능한 DESIGN.md 명세서를 생성하는 도구 DesignMD를 소개한다.

코딩 에이전트의 승부처는 모델 성능이 아닌 '설정 레이어'다

Claude Code의 설정 플러그인이 반복적인 프로젝트 환경 구축을 자동화하여 코딩 에이전트의 실질적인 생산성을 결정짓는 핵심 요소로 작용한다.

Claude CodeMCPVerdent

Claude로 영상 분석하기: 프레임 추출과 자막 매핑으로 구현하는 멀티모달 워크플로

yt-dlp, ffmpeg, Deepgram API를 조합하여 Claude가 영상을 이해할 수 있도록 프레임과 자막을 매핑하는 자동화 파이프라인을 구축했다.

디자인 에이전시 없이 고퀄리티 프로토타입을? Anthropic의 Claude Design 공개

Anthropic이 공개한 Claude Design은 아이디어를 즉시 시각적 프로토타입, 피치 덱, 웹 레이아웃으로 변환해주는 도구로, 브랜드 일관성을 유지하며 Canva, PowerPoint, HTML로 내보낼 수 있다.

AI가 자신 있게 거짓말을 할 때: 능력보다 신뢰성이 중요한 이유

AI 모델은 언어 패턴 예측에 뛰어나지만 사실 검증이 필요한 영역에서는 오류가 발생하므로, 고위험 작업에는 인간의 검증이 필수적이다.

AI 스마트 글래스가 실패한다면, 그 이유는 하드웨어가 아닌 인프라 때문일 것이다

AI 스마트 글래스는 실시간 데이터 처리를 위해 지속적인 고대역폭 업로드가 필요하지만, 현재의 네트워크 인프라는 다운로드 중심이라 병목 현상이 발생한다.

Artificial Intelligence Companies

연구 속도를 1000배 높이는 자율 AI 시스템, 과학의 미래를 바꿀까?

인간의 개입 없이 가설 설정부터 실험까지 수행하는 자율 AI 연구 시스템이 등장하며 과학 연구 속도가 획기적으로 빨라질 전망이다.

Anthropic의 흑자 전환과 SpaceX의 거대 데이터 센터 투자: AI 업계의 거대한 변화

SpaceX의 데이터 센터 투자, Anthropic의 수익성 개선, Google의 AI 에이전트 생태계 등 AI 업계의 주요 소식을 다룹니다.

AnthropicGoogleSpaceX

Hacker News - LLM Dev Tools

11개 AI 제공업체의 무료 토큰을 하나로, FreeLLMAPI 활용법

11개 AI 제공업체의 무료 LLM API 할당량을 통합하여 OpenAI 호환 프록시로 제공하는 오픈소스 도구.

FreeLLMAPI

100

Two Minute Papers Companies

멀티모달 모델의 KV 캐시를 90% 줄이는 시각적 추론 기법

바운딩 박스 좌표를 활용한 시각적 기본 요소 기법은 멀티모달 모델의 공간 추론 정확도를 높이고 KV 캐시 사용량을 90% 절감한다.

DeepSeek

TWIML AI Podcast Companies Architecture

LLM이 직접 쿼리를 생성하지 않게 하라: 안전한 데이터 검색을 위한 선언적 설계

LLM이 직접 쿼리를 생성하는 대신, 정의된 필드와 연산자만 사용하는 선언적 레지스트리를 통해 안전하고 제어 가능한 데이터 검색 시스템을 구축하는 방법.

데이터베이스의 구조를 이해하는 AI, 관계형 파운데이션 모델의 등장

스탠포드대 Jure Leskovec 교수가 기업의 관계형 데이터를 직접 학습하여 예측을 수행하는 관계형 파운데이션 모델의 원리와 활용 사례를 설명한다.

KumoRelational Foundation Models

TechCrunch AI Companies

구글의 강제적인 AI 검색이 싫다면? 사용자가 주목하는 대안 검색 엔진 6선

구글이 검색 엔진에 AI 오버뷰와 에이전트를 전면 도입하며 사용자 반발을 사는 가운데, 프라이버시와 사용자 제어를 강조하는 대안 검색 엔진들이 주목받고 있다.

Google

AI Engineer Language Models Companies

로컬부터 클라우드까지, 에이전트 워크플로우 선택 전략

VS Code 환경에서 로컬, 백그라운드, 클라우드 에이전트를 작업 성격에 맞춰 적재적소에 활용하는 워크플로우 전략을 다룬다.

Claude OpusMicrosoft

AI Engineer Coding Agents Language Models

대시보드는 초록색인데 사용자는 불만족? LLM 성능 측정의 함정 'Goodput'

LLM 성능 테스트 시 전체 요청 처리량(Throughput)만 측정하면 실제 사용자 경험을 반영하지 못하므로, SLO를 만족하는 유효 처리량(Goodput)을 함께 측정해야 한다.

하루 500개의 AI PR을 처리하는 자동화 에이전트 아키텍처

OpenClaw는 Agent Client Protocol 기반의 CLI 도구 acpx를 통해 AI 생성 PR을 자동으로 검증하고 처리하는 워크플로를 구축했다.

acpxCodex

The Verge AI Companies

스포티파이, 유니버설 뮤직과 손잡고 AI 리믹스·커버 생성 기능 도입

스포티파이가 유니버설 뮤직 그룹과 라이선스 계약을 맺고, 프리미엄 구독자를 위한 AI 기반 리믹스 및 커버 곡 생성 기능을 도입한다.

SpotifyUniversal Music Group

AWS ML Blog Dev Tools Language Models

Amazon Bedrock AgentCore로 대시보드 수정 요청을 자동화하여 업무 효율 극대화하기

Amazon Bedrock AgentCore와 Strands 프레임워크를 활용해 자연어 기반의 대시보드 검색 및 수정 자동화 에이전트를 구축하는 방법.

Amazon Bedrock AgentCoreAmazon NovaStrands Agents

AWS ML Blog Dev Tools Language Models

OPLOG가 AI 에이전트로 영업 주기 35% 단축하고 수동 연구 시간을 98% 줄인 방법

OPLOG는 Amazon Bedrock AgentCore와 Strands Agents SDK를 활용해 영업 파이프라인 분석, 데이터 품질 관리, 잠재 고객 조사를 자동화하는 AI 에이전트 시스템을 구축했다.

Amazon Bedrock AgentCoreClaude Sonnet

AWS ML Blog Products Architecture

컨텍스트 윈도우 한계를 넘는 Recursive Language Model 구현 가이드

Amazon Bedrock AgentCore와 Strands Agents SDK를 사용하여 긴 문서를 처리하는 Recursive Language Model(RLM) 구현 방법을 다룬다.

Amazon BedrockRecursive Language Model

AWS ML Blog

SaaS 에이전트 아키텍처의 핵심: Silo, Pool, Bridge 패턴으로 멀티 테넌시 구현하기

Amazon Bedrock AgentCore를 사용하여 멀티 테넌트 에이전트 애플리케이션의 격리, 보안, 비용 효율성을 달성하는 아키텍처 패턴과 구성 요소를 제시한다.

Wired AI Language Models Companies

Google Gemini로 만드는 나만의 AI 아바타, 직접 써보니

Google Gemini 앱에 추가된 아바타 기능을 통해 사용자는 자신의 모습을 닮은 AI 영상을 생성할 수 있다.

GeminiGoogle

TechCrunch AI Products Companies

Kubernetes 환경에 Kure Monitor를 배포하고 LLM 연동하는 방법

Helm 차트를 사용하여 Kubernetes 클러스터에 Kure Monitor를 설치하고 LLM 공급자를 연동하는 상세 가이드입니다.

스포티파이의 새로운 AI 에이전트, 내 일정과 이메일로 맞춤형 팟캐스트를 만든다

스포티파이가 개인 데이터와 웹 정보를 결합해 맞춤형 오디오 브리핑을 생성하는 데스크톱 앱 'Studio by Spotify Labs'를 공개했다.

NotebookLMSpotify

The Verge AI

할리우드가 주목하는 AI 비디오: 단순 클립 생성을 넘어선 에이전트 기반 제작의 시대

AI 비디오 기업들이 단순 영상 생성에서 벗어나 영화 제작 전 과정을 지원하는 에이전트 중심의 워크플로로 전환하고 있다.

TechCrunch AI Companies

Google의 새로운 AI 에이전트, 왜 사용자들에게 혼란을 주는가?

Google I/O 2026에서 공개된 다양한 AI 에이전트 기능과 이를 유료 구독 모델로 제한한 전략에 대한 비판적 분석.

Google

토니 로빈스가 공동 창업한 AI 테라피 앱 'The Path', 1,430만 달러 투자 유치

AI 테라피 앱 'The Path'가 1,430만 달러의 시드 투자를 유치하며, 기존 소비자용 챗봇과 차별화된 심리 치료 모델을 구축했다.

Databricks Blog Companies Products

7억 달러 투자 유치한 Hark, 차세대 AI 개인 비서와 전용 하드웨어 개발 나선다

Hark는 7억 달러 규모의 시리즈 A 투자를 유치하며 60억 달러의 기업 가치를 인정받았고, 이를 바탕으로 에이전트 AI 시스템과 전용 하드웨어 개발에 집중한다.

Databricks Genie로 데이터 분석 병목 현상을 해결하는 산업별 AI 솔루션

Databricks Genie를 활용하여 다양한 산업군에서 자연어 기반의 데이터 분석과 의사결정을 자동화하는 파트너 솔루션들을 정리한다.

DatabricksDatabricks Genie

AI Engineer Coding Agents Companies

코딩 에이전트가 1.88배 빠른 CUDA 커널을 작성하는 법

코딩 에이전트를 활용해 CUDA 커널 최적화, 모델 파인튜닝, 멀티 에이전트 연구를 자동화하는 실무 워크플로를 소개한다.

Claude CodeHugging FaceLiveCodeBench