2026년 5월 3일 AI 뉴스

Databricks Blog Companies

더 저렴하고 강력한 모델을 찾으시나요? 실시간 LLM 랭킹 및 가격 추적 서비스

LMSYS Arena의 LLM 랭킹과 OpenRouter의 실시간 가격 정보를 결합하여, 최적의 모델을 찾고 신규 모델 출시 시 알림을 받을 수 있는 추적 서비스입니다.

Artificial Intelligence

AI 인프라로 피벗하는 기업들과 MCP의 등장

AI 인프라로 전환하는 기업들의 전략과 MCP 출시, 그리고 AI에 대한 대중의 인식을 다룹니다.

NAVER D2

스펙 변경 시 프롬프트부터 학습까지 자동화하는 Closed Loop 파이프라인

쇼핑 에이전트 답변 모델 개발 시 스펙 변경에 대응하여 결함 탐지, 프롬프트 최적화, SFT 데이터 생성을 자동화하는 파이프라인 구축 경험 공유.

임커밋 Architecture

생성 모델의 핵심, Diffusion과 Flow Matching의 결정적 차이

Diffusion과 Flow Matching의 수식과 샘플링 과정을 비교하여 생성 모델의 작동 원리와 궤적 차이를 분석한다.

DiffusionFlow Matching

AWS ML Blog

반복 업무는 AI에게 맡기세요: Amazon Quick의 자율 에이전트와 데이터 통합 기능

Amazon Quick은 자율 에이전트와 통합 데이터 분석 기능을 통해 다양한 앱과 데이터 소스를 연결하고 반복 업무를 자동화하여 생산성을 높이는 AI 어시스턴트입니다.

AWS ML Blog

Amazon SageMaker Async Inference, 이제 S3 업로드 없이 인라인 페이로드 전송 가능

Amazon SageMaker AI Async Inference가 최대 128,000바이트의 인라인 페이로드 전송을 지원하여 S3 업로드 과정 없이 추론 요청이 가능해졌다.

Comet ML Blog

Claude Code 사용 시 놓치기 쉬운 비용 누수, 40% 절감하는 방법

Claude Code의 세션 시작 시 발생하는 MCP 서버와 컨텍스트 오버헤드를 식별하고, Opik을 통해 조직 단위로 비용을 관리하여 최대 40%까지 절감하는 전략.

Databricks와 NVIDIA가 공개한 차세대 AI 인프라: Vera CPU와 Agent Toolkit 통합

Databricks와 NVIDIA가 협력을 강화하여 AI Runtime, Model Serving, Vera CPU 기반의 엔드투엔드 AI 플랫폼을 구축한다.

DatabricksNVIDIA

Ars Technica AI

로봇이 스스로 GPU를 장착한다? NVIDIA가 공개한 자율 학습 프레임워크 ENPIRE

NVIDIA GEAR 연구소가 AI 에이전트가 로봇 학습 과정을 스스로 설계하고 실행하여 복잡한 물리적 작업을 자동화하는 프레임워크 ENPIRE를 개발했다.

aifeed.dev

아이디어 한 줄이면 끝, Fimo로 만드는 전문가 수준의 웹사이트

Fimo는 아이디어 설명만으로 콘텐츠와 디자인이 포함된 다중 페이지 웹사이트를 생성하는 AI 웹사이트 빌더입니다.

Modal Libraries Agents

AI 에이전트의 도구 연동을 최적화하는 FastMCP와 Modal 활용법

FastMCP 프레임워크와 Modal 샌드박스를 사용하여 AI 에이전트의 도구 연동을 효율화하고 안전한 코드 실행 환경을 구축하는 방법을 설명한다.

FastMCPMCPModal

Salesforce

UI 없는 AI 에이전트 시대, Salesforce가 제시하는 보안 아키텍처

Salesforce Headless 360은 UI를 분리하고 AI 에이전트가 기존 Salesforce 보안 정책을 상속받아 안전하게 데이터를 처리하도록 지원한다.

Roboflow Blog Vision AI Companies

실시간 키포인트 검출의 새로운 기준, RF-DETR Keypoint 프리뷰 공개

RF-DETR Keypoint는 확률적 손실 함수와 NAS를 활용해 실시간으로 고정밀 키포인트 검출을 수행하는 엔드투엔드 모델이다.

RF-DETRRoboflow

Wired AI Companies

로봇을 원격 조종하며 학습 데이터를 쌓는 중국 스타트업 IO-AI Tech

IO-AI Tech는 VR과 모션 트래킹 기술을 활용해 휴머노이드 로봇을 원격 제어하고, 이를 통해 로봇 자율 주행을 위한 학습 데이터를 수집한다.

IO-AI Tech

The AI Grid Products

iPhone에서 Apple Intelligence와 ChatGPT를 100% 활용하는 방법

iPhone에 탑재된 Apple Intelligence의 글쓰기 도구, 시각 지능, 실시간 번역, 이미지 생성 및 ChatGPT 연동 기능을 상세히 설명한다.

Apple IntelligenceChatGPTSiri

Latent Space (swyx)

소재 과학의 난제, AI 자율 실험실로 10배 빠르게 해결하기

Radical AI는 AI 과학자와 자동화 로봇을 결합한 자율 주행 실험실(SDL)을 통해 소재 발견 속도를 기존 대비 10배 이상 가속화하고 있다.

미국인 10명 중 4명은 AI가 사회에 부정적 영향을 미칠 것이라 본다

Pew Research 조사 결과, 미국인의 AI 사용은 증가하고 있으나 AI의 장기적 영향에 대한 사회적 인식은 여전히 부정적이고 회의적인 것으로 나타났다.

Hugging Face Blog Domain AI

자율주행 전문가들이 만든 월드 모델 스타트업 Odyssey, 14.5억 달러 유니콘 등극

자율주행 기술 기반의 월드 모델 스타트업 Odyssey가 아마존 등의 투자를 받아 14.5억 달러 기업 가치를 인정받았다.

iMerit Blog

3D 라벨 없이 1위 달성: iMerit의 CVPR 2026 자동 주석 파이프라인

iMerit은 CVPR 2026 Auto3D 챌린지에서 SAM 3와 CLIP 기반 검증을 활용한 자동 주석 파이프라인으로 1위를 차지했다.

Matt Wolfe

내 컴퓨터에서 돌아가는 AI 워크스페이스, Project Odysseus 실전 테스트

PewDiePie가 개발한 오픈소스 AI 플랫폼 Odysseus의 설치 과정과 로컬 모델 구동, Deep Research 및 이미지 편집 기능을 검증한다.

로봇 제어와 영상 생성을 혁신하는 3D 모션 예측 모델 MolmoMotion

AllenAI가 공개한 MolmoMotion은 언어 지시와 비디오를 기반으로 객체의 미래 3D 궤적을 예측하여 로봇 계획 및 영상 생성 성능을 향상시킨다.

MolmoMotion

Salesforce

기존 자동화 자산을 Agentforce 에이전트에 맞게 리팩터링하는 전략

기존 Salesforce 자동화 자산을 Agentforce 에이전트가 활용할 수 있도록 리팩터링하는 전략과 기술적 구현 방법을 다룬다.

AI LABS

AI 에이전트 스킬 설치 전 필수, NVIDIA Skill Spector로 보안 위협 차단하기

NVIDIA의 Skill Spector를 사용하여 AI 에이전트 스킬의 보안 취약점을 스캔하고, Claude Code와 연동하여 안전한 설치 워크플로를 구축하는 방법을 다룬다.

Vizuara

나만의 소형 언어 모델(SLM)을 밑바닥부터 직접 구축하는 4주 과정

데이터 준비부터 사전 학습, LoRA 파인튜닝, 추론 최적화 및 엣지 디바이스 배포까지 SLM 구축 전 과정을 다루는 실전 부트캠프.

AI Engineer

AI 에이전트가 웹 검색에 실패하는 이유와 해결책

AI 에이전트의 웹 접근 실패 원인인 안티봇 시스템과 CAPTCHA를 분석하고, Web MCP를 통한 안정적인 데이터 수집 방법을 다룬다.

Jeremy Jordan

AI 에이전트에게 24시간 개발을 맡기는 법: 인간은 가이드가 되어라

AI 코딩 에이전트에게 명확한 목표를 부여하고 24시간 자율적으로 작업하게 하는 'Continuous Work' 방법론과 인간의 가이드 역할에 대해 탐구합니다.

AI Andy Language Models Products

OpenRouter Fusion은 정말 Claude Opus 4.8보다 뛰어날까? 비용과 성능의 진실

OpenRouter의 compound model인 Fusion과 Claude Opus 4.8을 6가지 빌드 챌린지로 비교하여 성능과 비용 효율성을 분석한다.

Claude Opus 4.8FusionOpenRouter

DataRobot Blog

Google Antigravity CLI에서 DataRobot 에이전트 모니터링을 즉시 적용하는 방법

Google Antigravity CLI에 DataRobot 플러그인을 설치하여 LangGraph 에이전트의 실행 과정을 OpenTelemetry로 추적하고 디버깅하는 방법을 다룬다.

KDNugget

범용 AI 대신 나만의 AI 어시스턴트를 직접 구축해야 하는 이유와 방법

LangChain과 GPT-4o를 사용하여 개인의 작업 맥락을 이해하고 도구 사용이 가능한 맞춤형 AI 어시스턴트를 구축하는 실전 가이드.

The Verge AI

페이스북 게시물 기반의 메타 AI 검색, 과연 신뢰할 수 있을까?

메타가 페이스북 앱에 도입한 AI 검색 모드는 사용자 게시물을 기반으로 정보를 제공하지만, 여전히 환각 현상과 정보 오류 문제를 겪고 있다.

Hugging Face Blog Libraries

Databricks, AI 보안 강화: AIM, Context-Based Ingress, Private Network Gateway 공개

Databricks가 AI 워크로드의 보안과 규정 준수를 강화하기 위해 자동 ID 관리(AIM), Context-Based Ingress, Private Network Gateway 등 새로운 플랫폼 기능을 발표했다.

Dust

기업 데이터와 에이전트를 연결하는 멀티플레이어 AI 플랫폼, Dust

Dust는 기업 내 다양한 부서와 데이터를 연결하여 인간과 AI 에이전트가 협업하는 멀티플레이어 AI 플랫폼을 제공한다.

Mobileye

Mobileye가 제시하는 L2+ 자율주행의 대중화와 기술적 핵심

Mobileye는 L2+ 자율주행 시장의 급성장에 대응하여 고성능 SoC와 크라우드소싱 매핑 기술을 통합한 확장 가능한 ADAS 솔루션을 제시한다.

SentinelOne Blog

SOC의 병목 현상을 해결할 SentinelOne의 'Purple AI' 에이전트 조사 기능

SentinelOne이 EDR 경보를 자동으로 조사하고 증거를 수집하는 'Purple AI Agentic Investigation'을 출시하여 SOC의 조사 역량 부족 문제를 해결합니다.

KDNugget Coding Agents

OpenAI Codex로 웹부터 게임까지, 5가지 실전 프로젝트 따라하기

OpenAI Codex를 활용해 간단한 웹 앱부터 모바일 앱, 2D 게임, 풀스택 서비스까지 구축하는 5가지 실습 프로젝트를 다룬다.

OpenAI Codex

LangChain

AI 에이전트 시대, 기업은 어떻게 데이터 아키텍처를 재설계해야 하는가?

앤드류 응과 해리슨 체이스가 AI 에이전트의 발전, 엔터프라이즈 AI 도입 전략, 그리고 데이터 아키텍처의 중요성을 논의한다.

Dataiku Blog

생성형 AI 거버넌스 프레임워크: 속도와 통제를 동시에 잡는 6가지 핵심 기둥

생성형 AI의 위험을 관리하고 책임 있는 배포를 보장하기 위한 6가지 핵심 거버넌스 프레임워크와 운영 전략이다.

Strands Robots로 로봇 시뮬레이션부터 실제 하드웨어 배포까지 한 번에 해결하기

Strands Robots SDK는 LeRobot 스택을 에이전트 도구로 추상화하여 시뮬레이션과 실제 로봇 간의 워크플로를 통합하고 자연어 기반 제어를 지원한다.

LeRobot

IBM Technology

AI 에이전트가 내 비밀번호를 바꾼다? 보안 위협과 기회 사이

AI 에이전트의 보안 활용 가능성, 급증하는 취약점 관리, 경영진의 사이버 리스크 수용 전략을 논의한다.

AI Supremacy

OpenAI의 시장 점유율 하락과 SpaceXAI의 Cursor 인수: AI 시장의 판도가 바뀐다

OpenAI의 Codex가 범용 에이전트로 전환되는 가운데, SpaceXAI의 Cursor 인수와 경쟁사의 급성장으로 AI 시장 점유율 경쟁이 심화되고 있다.

Vizuara

AI가 복잡한 규칙을 스스로 학습하는 원리: 그레이디언트 핸드오프

복잡한 규칙을 직접 작성하는 대신, 대규모 학습 가능 함수와 경사 하강법을 통해 AI가 스스로 최적의 해를 찾아가는 그레이디언트 핸드오프 개념을 설명한다.

annotell Blog

자율주행 데이터 라벨링, Encord와 Kognic 중 무엇을 선택해야 할까?

Kognic은 자율주행 및 ADAS 데이터 라벨링에 특화된 플랫폼으로, 다중 센서 융합과 TISAX 인증을 통해 Encord보다 전문적인 AV 개발 환경을 지원한다.

MIT AI News

로봇이 사물 위치를 기억한다? MIT의 새로운 공간 기억 프레임워크 DAAAM

MIT 연구진이 로봇이 복잡한 환경에서 사물과 위치를 언어로 기억하고 추론할 수 있게 돕는 장기 공간 기억 프레임워크 DAAAM을 개발했다.

NAVER D2

매번 초기화되는 AI의 한계, 경험을 축적하고 스스로 성장하는 에이전트 프레임워크 'GNOSIS'

LLM 가중치를 변경하지 않고 외부 기억과 가치 레이어를 갱신하여 AI 에이전트의 자율적인 성장을 가능하게 하는 프레임워크 GNOSIS를 소개합니다.

メルカリエンジニアリングブログ

Claude Code로 PR 리뷰 자동화하고 수정 PR로 리뷰 스킬을 스스로 진화시키는 법

Claude Code의 커스텀 스킬을 활용해 PR 리뷰를 자동화하고, 수정된 PR을 분석하여 리뷰 기준을 지속적으로 업데이트하는 피드백 루프를 구축했다.

Salesforce Engineering Blog

AI 코딩 에이전트 도입의 9단계: 실험에서 운영 성숙도까지

AI 코딩 에이전트 도입 과정을 9단계 성숙도 모델로 정의하고, 단순 실험을 넘어 신뢰할 수 있는 엔지니어링 시스템으로 발전하는 전략을 제시한다.

NVIDIA AI Blog

AI 인프라의 핵심, 광학 부품 제조를 위한 텍사스 공장 확장

NVIDIA와 Coherent가 텍사스 셔먼에 인듐 인화물(InP) 웨이퍼 제조 시설을 확장하여 AI 데이터 센터의 고속 광학 연결성을 강화한다.

Midjourney Updates

미드저니가 준비한 첫 번째 비밀 하드웨어 프로젝트는 무엇일까?

미드저니가 6월 17일 오후 6시(태평양 표준시)에 디스코드와 X를 통해 첫 번째 비밀 하드웨어 프로젝트를 공개하는 라이브스트림을 진행한다.

Anyscale

애저 테넌트 내에서 관리형 Ray로 AI 인프라를 구축하는 방법

Anyscale on Azure를 통해 애저 환경 내에서 데이터 거버넌스를 유지하며 Ray 기반의 분산 AI 워크로드를 효율적으로 배포하고 운영하는 방법을 소개한다.

Cohere

AI는 노동 시장의 위협인가 기회인가? 경제학 모델로 본 AI의 미래

경제학적 모델과 실증 데이터를 통해 AI가 노동 시장의 생산성과 불평등에 미치는 영향을 분석하고 미래를 전망한다.

Intel Newsroom

Intel 18A-P 공정 리스크 생산 시작, 성능 9% 향상 및 전력 효율 개선

Intel Foundry가 차세대 공정 Intel 18A-P의 리스크 생산을 시작하며 기존 18A 대비 성능과 전력 효율을 대폭 개선했다.

Anthropic Research

Claude Code 분석: 코딩 실력보다 도메인 지식이 에이전트 활용의 핵심

40만 건의 Claude Code 세션을 분석한 결과, 코딩 기술보다 도메인 전문 지식이 에이전트 활용 효율과 성공률을 결정하는 핵심 요인임이 밝혀짐.

Alignment Forum

모델 출시 전 실제 행동을 미리 본다? 배포 시뮬레이션의 효과

과거 대화 데이터를 재현해 신규 모델의 배포 전 행동을 예측하고 잠재적 위험을 사전에 파악하는 배포 시뮬레이션 방법론을 다룬다.

Ars Technica AI

200시간 걸리던 의회 보고서, 생성형 AI로 5시간 만에 끝낸다

미 국방부가 생성형 AI를 도입하여 매년 의회에 제출해야 하는 수백 건의 보고서 작성 시간을 획기적으로 단축했다.

Roboflow Blog Vision AI Companies

타이어 측면 OCR 자동화: RF-DETR과 LLM으로 구현하는 비전 파이프라인

RF-DETR 모델로 타이어를 탐지하고 LLM으로 측면 정보를 추출하는 자동화된 비전 파이프라인 구축 방법.

RF-DETRRoboflow

LLM은 자신의 창조주를 더 선호할까? 5,000번의 실험으로 밝혀진 AI의 자기 편향성

5,000회 이상의 모의 조달 평가 실험을 통해 LLM이 자신의 창조주를 선호하거나 주입된 정체성에 따라 편향된 결정을 내리는 현상을 분석함.

ESP32-S3에서 실행하는 샌드박스형 코드 평가기 PySpell

PySpell은 ESP32-S3와 같은 마이크로컨트롤러에서 Python과 Rust의 안전한 하위 집합을 실행하는 샌드박스형 코드 평가기입니다.

모든 작업에 Claude Opus를 쓸 필요가 없습니다. Factory Router로 비용을 25% 절감하세요.

Factory Router는 코딩 작업 난이도에 따라 최적의 LLM을 자동으로 선택하여 성능은 유지하면서 API 비용을 최대 25% 절감합니다.

Hacker News - LLM Libraries

LLM 에이전트의 안전한 운영을 위한 결정론적 정책 및 감사 도구, Pramagent

LLM 에이전트의 도구 사용 정책, 인간 개입(HITL), 감사 추적을 제공하여 프로덕션 환경의 신뢰성을 높이는 오픈소스 미들웨어 프레임워크.

LLM은 체스를 얼마나 잘 둘까? 체스 실력과 지시 이행 능력을 동시에 평가하는 리더보드

LLM 체스 리더보드는 무작위 플레이어 및 체스 엔진과 대국을 통해 LLM의 체스 전략과 에이전트 환경에서의 지시 이행 능력을 정량적으로 평가한다.

chess

AWS ML Blog

AI 에이전트의 데이터 이해도를 높이는 AWS Context와 데이터 거버넌스 신기능

AWS가 AI 에이전트가 기업 데이터를 안전하고 정확하게 활용할 수 있도록 돕는 'AWS Context'와 Glue Data Catalog 및 S3 Annotations 신기능을 발표했다.

Techpresso Companies

Snap의 2,000달러 AR 글래스 출시와 Apple의 카메라 달린 AirPods 개발 소식

Snap의 고가 AR 글래스 출시, US-EU 간 AI 협력 논의, Apple의 카메라 내장 AirPods 개발 등 주요 테크 소식을 요약한다.

AppleSnap

TechCrunch AI Language Models Companies

제미나이로 똑똑해진 구글 홈 스피커, 자연어 명령과 멀티태스킹 지원

구글이 제미나이 AI를 탑재하여 자연어 이해와 복합 명령 처리가 가능한 99.99달러의 새로운 스마트 스피커를 출시했다.

GeminiGoogleGoogle Home Speaker

AWS ML Blog Products

에이전트 성능을 극대화하는 Amazon Bedrock AgentCore의 새로운 기능과 최적화 루프

Amazon Bedrock AgentCore가 RAG, 웹 검색, 유료 콘텐츠 연동 및 지속적 학습을 위한 최적화 루프를 통해 에이전트 개발과 운영을 지원한다.

AgentCoreAmazon Bedrock

LLM 코딩 생산성 극대화: AI에게 테스트 환경을 제공하는 법

LLM이 작성한 코드의 정확성을 보장하기 위해 브라우저, 테스트 스크립트, 이미지 비교 도구 등 검증 환경을 AI에게 제공하는 실무 전략을 다룬다.

로봇 학습 데이터 부족 해결사 XDOF, 7천만 달러 투자 유치하며 등장

XDOF는 로봇 학습을 위한 데이터 파이프라인과 수집 도구를 제공하여 로봇 AI 개발의 병목 현상을 해결하는 인프라 스타트업이다.

Hacker News - LLM Products

Temperature 0이어도 LLM 출력은 왜 달라질까? 비결정론적 추론의 원인과 해결책

LLM 추론 시 발생하는 비결정론적 출력의 원인인 부동소수점 연산과 배치 처리 문제를 분석하고, 캐싱 및 스케줄링을 통한 대응 전략을 제시한다.

LLM 프롬프트 테스트와 벤치마킹을 로컬에서 안전하게 수행하는 AptSelect

AptSelect는 로컬 SQLite 기반의 프롬프트 엔지니어링 워크벤치로, 여러 LLM의 응답을 병렬로 테스트하고 벤치마킹하며 API 키를 로컬에 안전하게 보관할 수 있습니다.

AptSelect

Hacker News - LLM Products Libraries

LLM 없이 실행 가능한 브라우저 에이전트, Lightpanda Agent 공개

Lightpanda Agent는 브라우저 자동화의 LLM 의존성을 빌드타임으로 제한하여 런타임 비용과 복잡성을 제거한 단일 바이너리 도구이다.

LightpandaPandaScript

LLM의 환각을 잡는다, Pramaana Labs가 도입한 수학적 검증 기술

Pramaana Labs는 LLM의 추론 결과에 수학적 형식 검증을 결합하여 법률 및 의료 등 고위험 분야에서 신뢰성을 보장하는 솔루션을 개발한다.

Databricks Free Edition 확장: GPU부터 AI 에이전트 개발까지 무료로

Databricks가 Free Edition에 Genie Code, GPU, Lakebase, Agent Bricks, Lakeflow Designer를 추가하여 데이터 및 AI 프로젝트를 위한 통합 무료 툴킷을 제공한다.

Databricks 파트너 개발 가속화: AI Dev Kit과 Firefly 오픈소스로 구현하는 아키텍처

Databricks가 파트너의 AI 제품 개발을 가속화하기 위해 AI 기반의 Well-Architected Framework와 Dev Kit, 오픈소스 참조 구현체인 Firefly를 공개했다.

Dataiku Blog Companies

AI 거버넌스 도입 기업이 미도입 기업보다 12배 더 빠르게 AI를 배포하는 이유

AI 거버넌스를 개발 과정에 내재화한 기업은 그렇지 않은 기업보다 AI 프로젝트 배포 속도가 12배 빠르고 ROI 달성 확률이 2.2배 높다.

Dataiku

여러 LLM을 합치면 더 똑똑해질까? LLM 위원회 구조의 숨겨진 함정

LLM 위원회 구조는 모델 간 합의를 유도하지만, 독창적이고 가치 있는 아이디어를 희석하는 집단 사고(Groupthink) 현상을 초래한다.

Hacker News - LLM Products

AI가 수학 문제를 다 푸는 시대, 인간의 수학 학습은 왜 여전히 고통스러울까?

LLM이 수학 문제를 해결하는 시대에도, 추상적 개념을 내재화하고 직관을 형성하는 수학 학습 과정에는 여전히 인간의 노력이 필수적이다.

LLM 전략 플래너와 규칙 검증 엔진의 결합: Noema64 오픈소스 프로젝트

Noema64는 LLM을 전략 플래너로 사용하고 Go 언어로 규칙을 검증하여 설명 가능한 수를 제시하는 오픈소스 체스 엔진이다.

Noema64

The Verge AI Domain AI Companies

인간 형태를 버린 범용 로봇, Genesis AI의 'Eno'가 지향하는 것은?

Genesis AI가 인간의 외형 대신 도구 사용 등 실질적 인간 능력을 모방한 범용 로봇 'Eno'를 공개하고 2026년 말 배포를 예고했다.

EnoGenesis AI

Siraj Raval Products

200개 상품 스크래핑 대결: AI 웹 스크레이퍼 3종 성능 비교

Thunderbit, Bright Data, Scraping Bee를 사용하여 동일한 이커머스 사이트에서 상품 데이터를 추출하는 성능을 비교하고 각 도구의 특징을 분석한다.

Bright DataScraping BeeThunderbit

Hugging Face Blog

1M 컨텍스트와 IndexShare 아키텍처로 무장한 오픈소스 모델 GLM-5.2 공개

1M 토큰 컨텍스트와 IndexShare 아키텍처를 도입하여 장기 코딩 작업 성능을 극대화한 오픈소스 모델 GLM-5.2가 공개됐다.

Anthropic이 공개한 프롬프트 캐싱으로 LLM API 비용 90% 절감하기

Anthropic의 프롬프트 캐싱은 반복되는 컨텍스트를 재사용하여 LLM API 호출 비용과 지연 시간을 크게 줄여주는 최적화 기술입니다.

Vizuara

"LLM이란 무엇인가?" 면접관을 사로잡는 100점짜리 답변 전략

LLM 기술 면접에서 단순 정의를 넘어 1원칙 사고와 심층적인 기술적 통찰을 보여주는 답변 프레임워크를 제시한다.

DeepSeek API와 로컬 모델을 지원하는 터미널 코딩 에이전트, cwcode

cwcode는 터미널에서 실행되는 Go 기반의 코딩 에이전트로, 해시 기반 편집과 프롬프트 캐싱을 통해 비용과 지연 시간을 최적화한다.

AWS ML Blog Products

Amazon Bedrock, 에이전트 AI를 위한 실시간 안전성 검사 API 공개

Amazon Bedrock의 새로운 InvokeGuardrailChecks API는 에이전트 AI 워크플로의 각 단계에서 리소스 생성 없이 세밀한 안전성 검사를 수행하고 점수 기반의 맞춤형 대응 로직을 구현하게 한다.

Amazon Bedrock

DeepMind Blog Companies

영국 주택 건축 허가 시간 50% 단축, Google DeepMind의 AI 계획 도구 공개

Google DeepMind와 영국 정부가 협력하여 주택 건축 허가 신청 처리 시간을 50% 단축하는 AI 계획 도구를 개발하고 있다.

Google DeepMind

AWS ML Blog Products

Amazon SageMaker AI, 컨테이너 캐싱 도입으로 모델 스케일링 지연 시간 50% 단축

Amazon SageMaker AI가 컨테이너 이미지 캐싱 기능을 도입하여 새로운 인스턴스 시작 시 이미지 다운로드 시간을 제거하고 엔드 투 엔드 스케일링 지연을 최대 50% 개선한다.

Amazon SageMaker AI

Databricks Blog Companies

데이터 파이프라인 설계의 정석: 배치부터 스트리밍까지 아키텍처 패턴 완벽 정리

데이터 파이프라인의 핵심 계층과 배치, 스트리밍, 메달리온 등 주요 아키텍처 패턴을 정의하고 실무 설계 원칙을 제시한다.

Databricks, 기업용 앱 개발 가속화하는 Genie App Builder와 서버리스 런타임 공개

Databricks가 기업 환경에서 안전하고 효율적인 앱 개발을 지원하는 App Spaces, Genie App Builder, 서버리스 마이크로 앱을 공개했다.

Databricks

AWS ML Blog MLOps Architecture

추론 속도 1.69배 향상: P-EAGLE을 활용한 병렬 speculative decoding

P-EAGLE은 speculative decoding의 순차적 병목을 해결하여 모든 draft 토큰을 단일 forward pass로 생성함으로써 추론 처리량을 최대 1.69배 개선한다.

Amazon SageMakerP-EAGLE

The Verge AI Companies Hardware

Android 17과 Wear OS 7 공개, Gemini Omni와 Lyria 3로 강화된 AI 경험

구글이 Android 17과 Wear OS 7을 출시하며 Gemini Omni, Lyria 3 등 최신 AI 모델을 통합한 새로운 픽셀 드롭 기능을 선보였다.

Roboflow Blog

객체 탐지 플리커링 방지: Roboflow의 새로운 Track Class Lock 기능

Roboflow의 Track Class Lock은 객체 탐지 시 발생하는 라벨 플리커링을 방지하여 데이터 안정성을 높이는 워크플로 블록이다.

퀄컴의 신형 칩 'Snapdragon Reality Elite', AI 스마트 글래스의 성능과 발열 문제 해결하나

퀄컴이 XR 기기용 신형 칩 'Snapdragon Reality Elite'를 공개하며 GPU, CPU, NPU 성능을 대폭 강화하고 발열과 배터리 효율을 개선했다.

QualcommSnapdragon Reality EliteXreal

The Verge AI Companies Products

Siri에 시각적 맥락을 제공할 카메라 탑재 AirPods, 2027년 출시 예정

애플이 Siri의 시각적 맥락 이해를 돕기 위한 카메라 탑재 AirPods와 차세대 폴더블 아이폰 등 2027년 출시 예정인 하드웨어 로드맵을 준비 중이다.

AppleSiri

TechCrunch AI Companies

AI 검색 결과에 브랜드 노출은 늘었지만, 소비자 신뢰는 오히려 하락했다

WordPress VIP 보고서에 따르면, 소비자는 AI 생성 답변에 대한 신뢰도가 낮으며 브랜드가 AI를 마케팅에 활용하는 것을 부정적으로 인식하는 경향이 있다.

WordPress VIP

Roboflow Blog

콘택트렌즈 결함 탐지: AI 모델과 자동화 워크플로로 검수 효율 높이기

Roboflow의 RF-DETR 모델과 워크플로를 사용하여 콘택트렌즈의 균열과 기포를 자동으로 탐지하고, 신뢰도에 따라 pass, review, fail로 분류하는 시스템을 구축한다.

Ars Technica AI

OpenAI의 매출은 130억 달러로 급증했으나, R&D 비용은 이를 압도했다

OpenAI의 2025년 매출은 130억 달러로 성장했으나, 연구개발 비용이 191억 달러에 달하며 수익성 확보에 난항을 겪고 있다.

LLM 판정 모델의 오류를 잡는 법: 섭동(Perturbation)을 활용한 평가 자동화

의료 보험 사전 승인(PA) 시스템에서 LLM 판정 모델의 신뢰성을 높이기 위해, 정답 데이터를 섭동시켜 오답을 생성하고 이를 모델이 정확히 탐지하는지 검증하는 평가 프레임워크를 구축했다.