2026년 6월 23일 AI 뉴스 아카이브

Schrodinger Resources

AI 에이전트가 약물 디자인의 정확도와 속도를 동시에 끌어올린다

물리 기반 시뮬레이션과 AI 에이전트가 엔드투엔드로 협업하는 새로운 워크플로우를 통해 정확도와 규모의 한계를 넘고 연구 속도와 의사결정의 신뢰성을 대폭 향상시킨다.

NVIDIA - Deep Learning Blog

특화 에이전트 구축의 모듈형 토대가 된다, NVIDIA Agent Toolkit

기업용 전문 에이전트를 위한 모듈형 구성으로 안전하고 확장 가능한 워크플로를 제공하는 NVIDIA Agent Toolkit의 핵심 아이디어를 제시한다.

Hacker News - LLM Libraries

객체에 내장된 AI로 프레임워크의 경계를 허문다

도메인 객체에 AI를 내장해 자연어 지시를 직접 실행하고, RAG 근거로 의사결정을 내리며 스키마 검증된 출력으로 바로 API와 UI에 연결한다.

ExoModel

Hacker News - LLM

역할 분리로 본 에이전트 평가의 핵심 교훈

탐색과 추론을 분리한 이중 에이전트 구조가 실행 오차를 줄이고 이해 기반의 실수를 감소시키며, 토폴로지 설계가 모델 크기보다 성능에 더 큰 영향을 준다는 것을 실험으로 보여준다.

Hugging Face Blog Libraries

경량 하네스로 에이전트형 앱을 빠르게 구축하는 CUGA의 실전 예제

CUGA는 프롬프트와 도구 목록만으로 에이전트형 앱을 빠르게 구성하고, 생산 환경에서 거버넌스와 확장을 가능한 한 줄의 코드로 제공합니다.

CUGA

Ben's Bites

Codex Record & Replay, Daybreak로 보안까지 한눈에 보는 주간 AI 업데이트

다양한 AI 도구의 최신 업데이트를 한 자리에 모아 실무 적용 포인트를 제시한다.

KDNugget

데이터 품질을 지키는 5가지 강력한 이상치 탐지 기법

다섯 가지 이상치 탐지 기법의 원리와 파이썬 예제를 비교해 데이터 품질과 분석 신뢰성을 높이는 방법을 제시한다.

개발동생

AI가 짜는 코드 절반으로 줄이는 '게으른 시니어 개발자' Ponytail

Ponytail은 AI 에이전트에게 YAGNI, KISS, DRY 원칙을 강제하여 불필요한 코드 생성을 억제하고 개발 효율을 높이는 스킬이다.

IBM Technology

현대 AI 에이전트의 동작 원리: 꼭 알아야 할 5가지 핵심 개념

현대 AI 에이전트 시스템의 동작 원리를 정의하는 5가지 핵심 아키텍처 패턴과 프로토콜을 설명한다.

Nicolai Nielsen

코딩 없이 전화 응대와 예약 자동화하는 AI 에이전트 만들기

Telnyx 플랫폼을 사용하여 전화 통화와 웹 위젯이 통합된 AI 음성 에이전트를 구축하고 배포하는 과정을 다룬다.

NVIDIA - Deep Learning Blog

ISC에서 본 NVIDIA의 AI HPC 주도력과 글로벌 확장

ISC 발표를 통해 81%의 TOP500 점유, Green500 선두, Grace/Grace Hopper/Vera의 풀스택 확장으로 NVIDIA가 AI HPC 생태계를 주도하고 전 세계의 연구 인프라를 확장하고 있음을 확인했다.

The AI Grid Companies Video Gen

30초 단일 샷 생성, 바이트댄스의 'Seedance 2.5'가 비디오 AI 판도를 바꾼다

바이트댄스가 30초 단일 샷 생성과 물리 세계 이해 능력을 갖춘 차세대 비디오 생성 모델 'Seedance 2.5'를 공개했다.

ByteDanceSeedance 2.5

Vizuara Domain AI Architecture

풀리지 않는 AI 문제, '차원'을 높여 해결하라

저차원에서 해결 불가능한 문제를 고차원으로 투영하여 패턴을 가시화하는 Expressivity의 원리와 LLM, CNN 등에서의 적용 사례를 다룬다.

NeRFTransformer

NAVER D2

GPU 부족 해결: AI 모델 서빙 비용과 성능을 잡는 Automatic Sharding 전략

수천 개의 AI 콘텐츠를 한정된 GPU 자원에서 효율적으로 서빙하기 위해 NP-Hard 문제를 해결하는 Automatic Sharding 시스템을 구축하고 성능을 개선했다.

MIT AI News Architecture Hardware

6mW 칩으로 소형 로봇의 실시간 3D 매핑 가능성 확장

초저전력 6mW 시스템온칩(Gleanmer)이 Gaussians 기반의 3D 맵 생성과 하드웨어 가속으로 소형 로봇의 실시간 매핑을 가능하게 하고, 메모리와 전력 소모를 대폭 줄였다.

GaussiansGleanmerGMMap

The AI Grid

모델을 자율적으로 조율하는 멀티 에이전트 시스템, Sakana Fugu의 성능은?

Sakana AI가 공개한 Fugu는 단일 API로 여러 모델을 동적으로 오케스트레이션하여 복잡한 작업을 자율적으로 해결하는 시스템이다.

LY Corporation

프롬프트 튜닝 자동화로 수일의 작업을 한 시간으로 단축하는 GEPA의 프롬프트 진화

GEPA의 Reflective Prompt Mutation과 DSPy 기반 자동 최적화는 프롬프트 후보를 자동으로 진화시키고 Pareto Front로 다축 최적화를 수행하여 LLM 프롬프트 튜닝의 비용과 시간을 크게 줄이고 정책 준수와 품질을 동시에 개선한다.

TechCrunch AI

AI로 성장과 해고를 동시에? 대기업의 해고 물결을 파헤치다

대형 기술 기업들이 매출 성장에도 불구하고 AI 도입을 이유로 대규모 인력 감축을 단행했고, 이는 AI 투자와 고용의 균형에 대한 재고를 촉발한다.

TechCrunch AI Companies

패치 더 플래닛으로 오픈소스 보안 부담을 AI가 덜다

오픈AI의 Patch the Planet은 Trail of Bits와 협력해 오픈 소스 보안 이슈를 유지보수자에게 도달하기 전에 선제적으로 탐지·패치를 돕는 협업 모델을 제시한다.

OpenAI

Cursor Dev Tools Products

AI가 개발 과정을 '블랙박스'로 만들지 않으려면? 개발자가 지켜야 할 본질

AI가 개발 루프를 가속화하는 시대에, 개발자가 AI의 단순 승인자가 아닌 주체적인 제작자로 남기 위한 인터페이스 철학을 다룬다.

CursorryOS

Simon Willison Coding Agents Domain AI

Claude Code로 브라우저에서 Moebius 0.2B 이미지 인페인팅 실행

Moebius 0.2B를 ONNX로 내보내고 WebGPU 기반 ONNX Runtime Web에서 브라우저에서 직접 구동하도록 Claude Code로 포팅하는 실험을 정리한다.

Claude CodeMoebiusONNX Runtime Web

Alignment Forum

LLM으로 트랜스크립트를 특징화하고 클러스터링해 모델 의도와 한계를 드러낸 연구

LLM으로 transcripts를 자동 특징화하고 임베딩-클러스터링-레이블링 파이프라인을 통해 모델 행동의 숨은 패턴과 한계를 정량화한다.

Latent Space (swyx)

그레이 스완의 자동화된 레드팀으로 AI 보안의 한계를 넘다

대형 언어 모델의 보안 취약점을 자동으로 식별하고 방어하는 Shade와 Cygnal의 조합이 엔터프라이즈 보안과 규제/compliance 체계에 중요한 역할을 한다.

The AI Daily Brief

NSA 보안 침해 논란부터 DeepMind 인재 유출까지, AI 업계의 긴박한 상황

Fable 5와 Mythos 보안 논란, DeepMind 인재 유출, 그리고 차세대 모델 출시 루머를 통해 본 AI 업계의 긴박한 경쟁 상황을 분석합니다.

Langflow

Langflow 1.10의 Memory Bases로 에이전트에게 장기 기억력을 부여하는 방법

Langflow 1.10의 Memory Bases 기능을 활용해 에이전트가 세션 간 대화 이력을 벡터 데이터베이스에 저장하고 장기적인 문맥을 유지하는 방법을 알아본다.

DataRobot Blog Best Practices Architecture

무단 AI 에이전트 관리—가시성 확보와 거버넌스 편입을 위한 실전 가이드

섀도우 에이전트가 거버넌스 밖에서 작동할 때 발생하는 리스크를 식별하고, 가시성 확보와 체계적 거버넌스를 통해 안전하게 실험과 운영의 균형을 맞추는 방법을 제시한다.

Audit TrailModel Context ProtocolShadow Agents

Cursor Dev Tools Products

Cursor가 공개한 3가지 혁신: 모바일 코딩, 에이전트 전용 Git, 그리고 차세대 모델

Cursor가 에이전트 중심 개발 환경을 위해 모바일 앱, 에이전트 전용 Git 플랫폼 Origin, 그리고 1.5T 파라미터 규모의 신규 모델을 발표했다.

CursorOrigin

AWS ML Blog Products Companies

에이전트 간 지능당 결제 인프라를 간편하게 구축하다

자율 에이전트가 여러 모델 공급자에 비용을 지불하고 운영되도록, Ampersend와 AgentCore Payments가 pay-per-intelligence 흐름과 2단계 결제 패턴을 제공한다.

Amazon Bedrock AgentCore PaymentsAmpersend

All About AI Coding Agents Companies

AI 에이전트로 자동 매매 전략 구축부터 백테스팅까지 실전 가이드

Codex 에이전트를 사용하여 Hyperliquid 플랫폼에서 매매 전략을 설계, 백테스팅, 최적화하고 섀도우 러닝 모드로 배포하는 전체 워크플로를 다룬다.

CodexHyperliquid

Roboflow Blog

RF-DETR과 Gemini로 매장 선반의 플래노그램 준수를 자동화하다

RF-DETR으로 빈 선반 영역을 탐지하고 Gemini로 브랜드 혼합 및 위치 이슈를 확인하는 Roboflow의 플래노그램 준수 자동화 워크플로우를 구축하는 방법을 설명한다.

Roboflow Blog

AI를 활용한 로봇 용접 품질 자동화 워크플로우

RF-DETR로 용접 이미지에서 Good Weld와 Bad Weld를 로컬라이즈하고, Gemini 2.5 Pro로 자동 인스펙션 요약을 생성하는 엔드-투-엔드 파이프라인을 Roboflow로 구축한다.

AWS ML Blog

수십 억 픽셀의 항공 이미지를 자연어로 검색하는 실전 파이프라인

다중 뷰 항공 영상의 임베딩·캡션링·벡터 검색을 모듈형 아키텍처로 구현하고, Nova 멀티모달 임베딩과 캡션의 결합이 검색 품질에 가장 큰 영향을 준다는 점을 실험으로 확인했다.

Chris Raroque

로컬 AI가 바꾸는 개발 환경: Microsoft Build 참관기

Microsoft Build에서 확인한 로컬 AI 모델의 효율성과 하드웨어 SDK의 변화를 다룬 참관기.

IBM Research Libraries

온프렘 환경에서 비용과 지연을 줄이는 llm-d의 다중 벤더 GPU 활용

온프렘 환경에서 llm-d가 다중 벤더 GPU를 효율적으로 배치해 처리량을 높이고 비용을 절감하며, 프리필-디코딩 분리로 각 단계의 최적화를 가능하게 한다.

llm-d

Hacker News - LLM

다중 턴 대화의 기하학적 지표로 LLM 공격을 조기에 탐지하는 PsychoPass

대화의 임베딩 공간 궤도를 분석해 다중 턴 대화에서의 공격 가능성을 조기에 예측하고 온라인 모니터링을 가능하게 하는 프레임워크를 제안한다.

Hacker News - LLM Dev Tools

로컬 캐시로 LLM 호출 비용을 크게 낮추는 Cachet의 비밀

Cachet은 OpenAI/Anthropic 호환 API 앞에 두는 100% 로컬 세맨틱 캐시로 중복 프롬프트의 비용과 지연을 실시간으로 절감한다.

Cachet

NVIDIA - Deep Learning Blog Companies

자율 네트워크의 실전 로드맵: AI 에이전트로 네트워크를 스스로 움직인다

AI 에이전트와 시뮬레이션 기반 검증으로 텔레콤 네트워크를 자율 운영하는 실전 로드맵을 제시한다.

SoftBank Corp.

Hacker News - LLM Domain AI

Big Five와 정신건강을 반영하는 LLM 어댑터의 구현

대형 모델의 텍스트 출력에 Big Five 성격 특성과 정신건강 지표를 반영하도록 파라미터 효율적 어댑터를 활용하는 구현 방법이다.

PsychAdapter

TechCrunch AI

Claude Code의 루프가 코드 자동 작성을 이끄는가?

에이전트 간 루프가 코드 자동 작성의 가능성을 제시하고, 코드 아키텍처 개선과 비용 관리의 균형이 핵심 과제로 떠올랐다.

Wired AI Companies

메타의 AI 재편, 내부 보안 이슈와 프라이버시 논란의 전말

메타의 AI 재편이 직원 데이터 수집과 모니터링 이슈를 불러오며, 보안과 프라이버시에 대한 논쟁으로 번졌고 내부 거버넌스 문제까지 드러났다.

NVIDIA의 물 재순환 냉각으로 데이터센터 물 사용이 달라진다

NVIDIA의 45°C 냉각 루프는 데이터센터 내부 물 사용을 크게 줄일 수 있지만, 전체 물 발자국은 전력 생산과 제조에서 발생하는 물 사용으로 여전히 크게 남아 있다.

Nvidia

Hacker News - LLM Architecture

제로 코드 변경으로 LLM 비용을 40–70%까지 절감하는 방법

애플리케이션과 AI 공급자 사이에 시맨틱 캐싱 레이어를 두어 반복 질의의 API 호출을 줄이고 코드 수정 없이 비용을 대폭 낮춘다.

Semantic Caching

KDNugget Companies Products

다수 모델을 한 곳에서 관리하는 AI 워크스페이스, ChatLLM 리뷰

ChatLLM은 여러 모델을 하나의 인터페이스에서 제공하고 문서 분석, 코딩 도구, 이미지 생성, 자동화까지 포괄하는 올인원 AI 워크스페이스이다.

Abacus AIChatLLM

TechCrunch AI Hardware Companies

SpaceX 칩으로 여는 오픈소스 AI의 새로운 경쟁 구도

Reflection AI가 SpaceX와 대규모 컴퓨트 계약을 체결해 Nvidia GB300 칩에 대한 즉시 접근과 Colossus 2 데이터센터 활용권을 확보하고, 오픈-웨이트 AI 생태계 확장을 가속한다.

GB300SpaceX

Hacker News - LLM Products

가격 감시로 안전하게 예산 관리, 8주 간의 LLM 가격 스냅샷 공개

8주간의 자동 가격 스크래핑으로 주요 공급자의 가격 유지 현황과 600배에 달하는 가격 스프레드를 확인하고, Together AI의 가격 변경 주도 사례를 통해 가격 모니터링의 필요성과 TokenPrices의 실무적 도구화를 제시한다.

TokenPrices

AWS ML Blog Libraries Products

ComfyUI와 SageMaker로 콘텐츠 생산 파이프라인을 자동화하는 실전 가이드

ComfyUI 워크플로우를 SageMaker AI 처리로 배치 실행해 대규모 이미지·오디오·비디오 생성을 자동화하고, GPU 기반 인프라와 CDK 구성을 통해 속도와 비용 효율을 동시에 개선한다.

ComfyUISageMakerZ-Image Turbo

Two Minute Papers Companies

GPU를 늘려도 느린 에이전트 추론, DualPath로 해결하는 법

DualPath는 유휴 디코드 머신을 활용해 KV 캐시 처리 대역폭 병목을 해결하고 GPU 활용률을 2배 높이는 추론 최적화 기법이다.

DeepSeek

Hacker News - LLM Companies Products

지연 시간 기반 라우팅으로 LLM 공급자 간 트래픽을 자동 최적화하는 경량 사이드카

sturnus는 OpenAI 호환 API를 제공하는 경량 사이드카로, 가장 빠른 공급자에 트래픽을 집중시켜 LLM 응답 속도와 가용성을 높인다.

OpenAIsturnus