AI 에이전트가 약물 디자인의 정확도와 속도를 동시에 끌어올린다
물리 기반 시뮬레이션과 AI 에이전트가 엔드투엔드로 협업하는 새로운 워크플로우를 통해 정확도와 규모의 한계를 넘고 연구 속도와 의사결정의 신뢰성을 대폭 향상시킨다.
총 48건
물리 기반 시뮬레이션과 AI 에이전트가 엔드투엔드로 협업하는 새로운 워크플로우를 통해 정확도와 규모의 한계를 넘고 연구 속도와 의사결정의 신뢰성을 대폭 향상시킨다.
기업용 전문 에이전트를 위한 모듈형 구성으로 안전하고 확장 가능한 워크플로를 제공하는 NVIDIA Agent Toolkit의 핵심 아이디어를 제시한다.
도메인 객체에 AI를 내장해 자연어 지시를 직접 실행하고, RAG 근거로 의사결정을 내리며 스키마 검증된 출력으로 바로 API와 UI에 연결한다.
탐색과 추론을 분리한 이중 에이전트 구조가 실행 오차를 줄이고 이해 기반의 실수를 감소시키며, 토폴로지 설계가 모델 크기보다 성능에 더 큰 영향을 준다는 것을 실험으로 보여준다.
CUGA는 프롬프트와 도구 목록만으로 에이전트형 앱을 빠르게 구성하고, 생산 환경에서 거버넌스와 확장을 가능한 한 줄의 코드로 제공합니다.
다양한 AI 도구의 최신 업데이트를 한 자리에 모아 실무 적용 포인트를 제시한다.
Ponytail은 AI 에이전트에게 YAGNI, KISS, DRY 원칙을 강제하여 불필요한 코드 생성을 억제하고 개발 효율을 높이는 스킬이다.
현대 AI 에이전트 시스템의 동작 원리를 정의하는 5가지 핵심 아키텍처 패턴과 프로토콜을 설명한다.
Telnyx 플랫폼을 사용하여 전화 통화와 웹 위젯이 통합된 AI 음성 에이전트를 구축하고 배포하는 과정을 다룬다.
ISC 발표를 통해 81%의 TOP500 점유, Green500 선두, Grace/Grace Hopper/Vera의 풀스택 확장으로 NVIDIA가 AI HPC 생태계를 주도하고 전 세계의 연구 인프라를 확장하고 있음을 확인했다.
바이트댄스가 30초 단일 샷 생성과 물리 세계 이해 능력을 갖춘 차세대 비디오 생성 모델 'Seedance 2.5'를 공개했다.
저차원에서 해결 불가능한 문제를 고차원으로 투영하여 패턴을 가시화하는 Expressivity의 원리와 LLM, CNN 등에서의 적용 사례를 다룬다.
수천 개의 AI 콘텐츠를 한정된 GPU 자원에서 효율적으로 서빙하기 위해 NP-Hard 문제를 해결하는 Automatic Sharding 시스템을 구축하고 성능을 개선했다.
초저전력 6mW 시스템온칩(Gleanmer)이 Gaussians 기반의 3D 맵 생성과 하드웨어 가속으로 소형 로봇의 실시간 매핑을 가능하게 하고, 메모리와 전력 소모를 대폭 줄였다.
Sakana AI가 공개한 Fugu는 단일 API로 여러 모델을 동적으로 오케스트레이션하여 복잡한 작업을 자율적으로 해결하는 시스템이다.
GEPA의 Reflective Prompt Mutation과 DSPy 기반 자동 최적화는 프롬프트 후보를 자동으로 진화시키고 Pareto Front로 다축 최적화를 수행하여 LLM 프롬프트 튜닝의 비용과 시간을 크게 줄이고 정책 준수와 품질을 동시에 개선한다.
대형 기술 기업들이 매출 성장에도 불구하고 AI 도입을 이유로 대규모 인력 감축을 단행했고, 이는 AI 투자와 고용의 균형에 대한 재고를 촉발한다.
오픈AI의 Patch the Planet은 Trail of Bits와 협력해 오픈 소스 보안 이슈를 유지보수자에게 도달하기 전에 선제적으로 탐지·패치를 돕는 협업 모델을 제시한다.
Moebius 0.2B를 ONNX로 내보내고 WebGPU 기반 ONNX Runtime Web에서 브라우저에서 직접 구동하도록 Claude Code로 포팅하는 실험을 정리한다.
LLM으로 transcripts를 자동 특징화하고 임베딩-클러스터링-레이블링 파이프라인을 통해 모델 행동의 숨은 패턴과 한계를 정량화한다.
대형 언어 모델의 보안 취약점을 자동으로 식별하고 방어하는 Shade와 Cygnal의 조합이 엔터프라이즈 보안과 규제/compliance 체계에 중요한 역할을 한다.
Fable 5와 Mythos 보안 논란, DeepMind 인재 유출, 그리고 차세대 모델 출시 루머를 통해 본 AI 업계의 긴박한 경쟁 상황을 분석합니다.
Langflow 1.10의 Memory Bases 기능을 활용해 에이전트가 세션 간 대화 이력을 벡터 데이터베이스에 저장하고 장기적인 문맥을 유지하는 방법을 알아본다.
섀도우 에이전트가 거버넌스 밖에서 작동할 때 발생하는 리스크를 식별하고, 가시성 확보와 체계적 거버넌스를 통해 안전하게 실험과 운영의 균형을 맞추는 방법을 제시한다.
자율 에이전트가 여러 모델 공급자에 비용을 지불하고 운영되도록, Ampersend와 AgentCore Payments가 pay-per-intelligence 흐름과 2단계 결제 패턴을 제공한다.
Codex 에이전트를 사용하여 Hyperliquid 플랫폼에서 매매 전략을 설계, 백테스팅, 최적화하고 섀도우 러닝 모드로 배포하는 전체 워크플로를 다룬다.
RF-DETR으로 빈 선반 영역을 탐지하고 Gemini로 브랜드 혼합 및 위치 이슈를 확인하는 Roboflow의 플래노그램 준수 자동화 워크플로우를 구축하는 방법을 설명한다.
RF-DETR로 용접 이미지에서 Good Weld와 Bad Weld를 로컬라이즈하고, Gemini 2.5 Pro로 자동 인스펙션 요약을 생성하는 엔드-투-엔드 파이프라인을 Roboflow로 구축한다.
다중 뷰 항공 영상의 임베딩·캡션링·벡터 검색을 모듈형 아키텍처로 구현하고, Nova 멀티모달 임베딩과 캡션의 결합이 검색 품질에 가장 큰 영향을 준다는 점을 실험으로 확인했다.
Microsoft Build에서 확인한 로컬 AI 모델의 효율성과 하드웨어 SDK의 변화를 다룬 참관기.
온프렘 환경에서 llm-d가 다중 벤더 GPU를 효율적으로 배치해 처리량을 높이고 비용을 절감하며, 프리필-디코딩 분리로 각 단계의 최적화를 가능하게 한다.
대화의 임베딩 공간 궤도를 분석해 다중 턴 대화에서의 공격 가능성을 조기에 예측하고 온라인 모니터링을 가능하게 하는 프레임워크를 제안한다.
Cachet은 OpenAI/Anthropic 호환 API 앞에 두는 100% 로컬 세맨틱 캐시로 중복 프롬프트의 비용과 지연을 실시간으로 절감한다.
AI 에이전트와 시뮬레이션 기반 검증으로 텔레콤 네트워크를 자율 운영하는 실전 로드맵을 제시한다.
대형 모델의 텍스트 출력에 Big Five 성격 특성과 정신건강 지표를 반영하도록 파라미터 효율적 어댑터를 활용하는 구현 방법이다.
에이전트 간 루프가 코드 자동 작성의 가능성을 제시하고, 코드 아키텍처 개선과 비용 관리의 균형이 핵심 과제로 떠올랐다.
NVIDIA의 45°C 냉각 루프는 데이터센터 내부 물 사용을 크게 줄일 수 있지만, 전체 물 발자국은 전력 생산과 제조에서 발생하는 물 사용으로 여전히 크게 남아 있다.
애플리케이션과 AI 공급자 사이에 시맨틱 캐싱 레이어를 두어 반복 질의의 API 호출을 줄이고 코드 수정 없이 비용을 대폭 낮춘다.
Reflection AI가 SpaceX와 대규모 컴퓨트 계약을 체결해 Nvidia GB300 칩에 대한 즉시 접근과 Colossus 2 데이터센터 활용권을 확보하고, 오픈-웨이트 AI 생태계 확장을 가속한다.
8주간의 자동 가격 스크래핑으로 주요 공급자의 가격 유지 현황과 600배에 달하는 가격 스프레드를 확인하고, Together AI의 가격 변경 주도 사례를 통해 가격 모니터링의 필요성과 TokenPrices의 실무적 도구화를 제시한다.
ComfyUI 워크플로우를 SageMaker AI 처리로 배치 실행해 대규모 이미지·오디오·비디오 생성을 자동화하고, GPU 기반 인프라와 CDK 구성을 통해 속도와 비용 효율을 동시에 개선한다.
DualPath는 유휴 디코드 머신을 활용해 KV 캐시 처리 대역폭 병목을 해결하고 GPU 활용률을 2배 높이는 추론 최적화 기법이다.
sturnus는 OpenAI 호환 API를 제공하는 경량 사이드카로, 가장 빠른 공급자에 트래픽을 집중시켜 LLM 응답 속도와 가용성을 높인다.