미국 정부가 승인한 AI 의사? Medicare의 10년 의료 혁신 실험
미국 CMS가 AI 기반 의료 서비스의 성과에 따라 보상하는 ACCESS 프로그램을 통해 의료 AI 상용화의 새로운 장을 엽니다.
총 100건
미국 CMS가 AI 기반 의료 서비스의 성과에 따라 보상하는 ACCESS 프로그램을 통해 의료 AI 상용화의 새로운 장을 엽니다.
Rust와 순수 CUDA 커널을 사용하여 vLLM 대비 3배 이상의 성능과 2.5GB의 경량 이미지를 제공하는 새로운 LLM 추론 엔진 Atlas가 공개되었습니다.
Salesforce는 AI 에이전트의 기술적 정확도와 실제 사용자 가치 사이의 간극을 메우기 위해 3단계 심각도 티어와 11가지 휴리스틱 평가 체계를 제안한다.
xAI가 미시시피주 데이터 센터에 환경 단체의 소송과 규제 논란 속에서도 19대의 가스 터빈을 추가로 설치하여 총 46대를 가동 중인 것으로 드러났다.
소프트웨어 패치 문서를 위장해 LLM의 가드레일을 무력화하는 새로운 단일 시도 탈옥 기법인 'Hi-Vis 공격'이 공개됐다.
허깅페이스 파리 본사를 방문하여 오픈소스 로보틱스 프레임워크 LeRobot 팀의 기술적 지향점과 데이터 전략, 그리고 로봇 AI의 미래를 탐구한다.
샌프란시스코 스타트업 SPAN이 주택에 액체 냉각 GPU 노드를 설치하여 AI 연산력을 확보하고 거주자에게 전기료 혜택을 주는 분산형 데이터 센터 계획을 공개했다.
아마존 개발자들의 AI 사용량 조작 실태와 구글-스페이스X의 우주 데이터 센터 협력, 그리고 Anthropic의 법률 AI 시장 진출 전략을 다룹니다.
Mistral AI는 기술 규모 경쟁 대신 유럽 시장의 규제와 데이터 주권을 공략해 1년 만에 ARR 20배 성장을 기록했다.
구글의 차세대 멀티모달 모델 Gemini Omni가 유출되었으며 기존 Veo 모델을 뛰어넘는 강력한 비디오 생성 능력과 높은 연산 비용이 특징이다.
ClearML의 오케스트레이션 대시보드와 감사 기능을 통해 AI 워크로드의 리소스 사용량, 실행 환경, 모델 계보를 통합 관리하고 규정 준수를 달성하는 방법을 제시합니다.
Anthropic이 승인되지 않은 비상장 주식 거래 및 투자 사기에 대해 공식 경고를 발표하며 비공개 AI 시장의 불투명성과 위험성을 지적했다.
생성형 AI 프로젝트의 프로덕션 전환 실패를 해결하기 위해 강화학습(RL)을 활용한 피드백 통합 및 합성 데이터 생성 파이프라인 구축 방안을 제시한다.
Vercel AI SDK v6의 지속성 샌드박스와 파일 시스템을 활용해 스스로 도구를 생성하고 문맥을 유지하는 고성능 에이전트 구축 방법을 다룹니다.
구글과 스페이스X가 AI 연산 비용 절감을 위해 우주 공간에 궤도 데이터 센터를 구축하는 방안을 논의 중입니다.
Skywork AI를 사용하여 단일 프롬프트로 레이어 편집이 가능한 포스터, 로고, 인포그래픽을 생성하고 수정하는 실전 워크플로우를 소개한다.
Databricks가 별도의 ETL 파이프라인이나 추가 컴퓨팅 비용 없이 Lakebase 데이터를 Unity Catalog 관리형 테이블로 자동 복제하는 Native Lakehouse Sync 기능을 발표했습니다.
구글이 안드로이드 스마트폰에서 제미나이를 활용해 여러 앱을 넘나들며 복잡한 작업을 스스로 수행하는 앱 자동화 기능을 확대합니다.
OpenAI의 ChatGPT가 19세 대학생에게 치명적인 약물 조합을 권장하여 사망에 이르게 했다는 혐의로 유족으로부터 소송을 당했다.
219명의 엔지니어링 리더를 대상으로 한 설문 조사 결과, 코드의 48%가 AI로 생성되고 있으나 코드베이스에 대한 이해도 저하와 역할 정의의 부재가 심각한 문제로 나타났다.
Roboflow의 RF-DETR 모델과 OC-SORT 트래커를 결합하여 고속으로 이동하는 야구공과 선수의 움직임을 실시간으로 추적하고 시각화하는 기술 가이드입니다.
메타가 패밀리 센터를 통합하여 여러 앱의 자녀 계정을 한곳에서 관리하게 하고, 인스타그램 알고리즘을 구성하는 관심사 주제를 부모가 확인할 수 있는 기능을 도입했습니다.
AI 모델 개발 비용의 대부분이 최종 학습이 아닌 R&D에 집중됨에 따라, 지식 공유를 통해 중복 투자를 피하는 오픈 소스 생태계가 장기적인 비용 우위를 점할 수 있다.
MIT Technology Review가 AI의 핵심 트렌드로 부상한 월드 모델의 개념과 현실 세계 이해 가능성을 논의합니다.
Amazon Bedrock과 AI 에이전트를 활용하여 레이블이 없는 대규모 문서 집합을 자동으로 클러스터링하고 IDP용 추출 스키마를 생성하는 기술을 소개합니다.
자율 코딩 에이전트인 Claude Code를 사용하여 예측 시장 플랫폼 폴리마켓에서 수익을 창출하는 고빈도 매매 봇을 설계하고 실시간 대시보드까지 구축하는 과정을 보여준다.
리비안이 차량 하드웨어 제어와 서드파티 앱 연동이 가능한 자체 개발 AI 음성 비서 'Rivian Assistant'를 정식 출시했습니다.
AI 에이전트의 일관된 행동과 가치 정렬을 통해 고객 신뢰를 구축하는 '성격 기반 AI'의 개념과 구현 전략을 제시한다.
MIT Open Learning이 비전공자를 위해 AI 기초부터 산업별 응용까지 다루는 개인화된 온라인 교육 프로그램 'Universal AI'를 출시했다.
Anthropic의 Claude Design과 Google의 Stitch를 기능, 비용, 디자인 품질, 코드 연동성 등 다각도에서 비교 분석하여 최적의 AI 디자인 워크플로우를 제안한다.
Valkey와 BetterDB를 활용하여 RAG 파이프라인에 시맨틱 캐싱을 적용하고, MCP를 통해 자연어로 시스템을 모니터링하는 프로덕션 수준의 구축 방법을 제시한다.
AI 주권은 데이터 거주지를 넘어 벤더 종속성 탈피와 기술 스택 전반에 대한 통제력 및 유연성을 확보하는 비즈니스 독립성 전략이다.
대규모 데이터셋 처리 시 Pandas의 성능 한계를 극복하기 위해 Rust 기반 Polars의 병렬 처리와 지연 평가를 활용한 성능 최적화 사례를 분석한다.
NVIDIA와 SAP가 협력하여 오픈소스 런타임 OpenShell을 통해 기업용 자율 AI 에이전트의 보안, 정책 집행 및 거버넌스 제어 기능을 강화한다.
AI 토큰 단가는 하락하고 있으나, 에이전트 기반의 과도한 소비와 가시성 부족으로 인해 기업의 전체 AI 지출은 오히려 급증하고 있으며 이를 관리하기 위한 워크플로 중심의 거버넌스가 시급하다.
AI가 생성한 최초의 제로데이 익스플로잇 발견과 OpenAI의 새로운 보안 모델 출시 등 AI 기술의 최신 보안 및 산업 동향을 다룹니다.
시계열 데이터의 리샘플링, 이상치 탐지, 성분 분해, SARIMA 예측 및 다중 시계열 비교를 자동화하는 5가지 핵심 Python 스크립트를 소개합니다.
Nous Research가 공개한 Hermes Agent는 스케줄링, 도구 통합, 상태 관리를 지원하는 고급 AI 에이전트 구축용 오픈소스 런타임입니다.
일본 RIKEN AIP 연구소가 세계적 AI 학회인 ICML 2026에서 총 42편의 논문을 채택시키는 성과를 거두었습니다.
OnDemand 플랫폼의 마켓플레이스, 플레이그라운드, 플로우 빌더를 사용하여 비즈니스용 멀티 에이전트 시스템을 구축하고 자동화하는 방법을 제시한다.
14개 LLM을 대상으로 코드 분석 성능과 비용을 벤치마크한 결과, DeepSeek V4 Flash가 압도적인 가성비를 보였으며 고가 모델의 비용 효율성은 낮은 것으로 나타났다.
AI 에이전트가 로그상 성공을 보고하더라도 실제 작업이 누락되는 문제를 해결하기 위해 4단계 사후 검증 프로세스를 도입하여 신뢰성을 확보했다.
MCP를 통해 Claude Desktop과 Blender를 직접 연결하여 실시간 3D 모델링 및 시각적 피드백 루프를 구축하는 실전 워크플로가 공유되었다.
Thinking Machines가 200ms 단위의 마이크로 턴 구조를 통해 실시간 멀티모달 상호작용을 구현한 TML-Interaction-Small 모델을 공개했습니다.
Claude의 '스킬' 기능을 활용해 비디오 제작, API 문서화, 재무 모델링 등 9가지 전문 작업을 자동화하고 생산성을 높인 실무 경험 공유이다.
Modal은 클라우드 버퍼, 커스텀 파일시스템, CPU/GPU 체크포인트 기술을 결합하여 GPU 서버리스 추론의 콜드 스타트 지연을 2,000초에서 50초로 단축했습니다.
독립 연구자 knowurknot이 개발한 46개 모듈 기반의 비통계적 인지 아키텍처 CAPT의 구조와 특징을 IBM Granite 모델의 분석을 통해 공개합니다.
LLM 추론의 핵심 병목인 메모리 대역폭 문제를 분석하고, KV 캐시 최적화, 추측 디코딩, 연속 배칭 등 최신 성능 향상 기법을 다룹니다.
UC 샌디에이고의 Michael Yip 교수가 이미지 기반 제어부터 물리 시뮬레이션, 휴머노이드 로봇을 활용한 의료 보조까지 자율 수술 로봇의 핵심 기술과 미래 방향을 제시한다.
AWS 인프라와 오픈소스 소프트웨어 스택을 활용하여 파운데이션 모델의 사전 학습, 사후 학습, 테스트 시간 컴퓨팅을 최적화하는 4계층 아키텍처 가이드
기존의 AI 모델 학습 방식은 교사 모델의 내부 데이터(로짓)가 꼭 필요해 폐쇄형 모델을 교사로 쓰기 어려웠습니다. 이 논문은 텍스트로 된 평가 기준(루브릭)만으로도 모델을 효과적으로 가르칠 수 있음을 증명하여, GPT-5와 같은 강력한 API 모델을 활용한 효율적인 모델 학습의 길을 열었습니다.
시각 언어 모델(VLM)이 실제 서비스에 도입되면서 이미지에 숨겨진 미세한 노이즈로 모델을 속이는 적대적 공격이 심각한 보안 위협으로 부상했다. 이 논문은 추가적인 재학습 없이도 기존 모델에 간단히 끼워 넣어 공격을 실시간으로 감지할 수 있는 가벼운 방화벽 기술을 제시하여 VLM의 실무 안전성을 크게 높였다.
Aegis DQ는 LLM을 활용해 데이터 품질 규칙을 자동 생성하고, 오류 발생 시 근본 원인 분석과 SQL 복구 쿼리까지 제공하는 에이전트형 프레임워크이다.
Exim 메일 서버의 중대한 Use-After-Free 취약점(CVE-2026-45185) 발견 과정과 AI 에이전트를 활용한 자동화된 익스플로잇 개발 가능성을 탐구한다.
FairyFuse는 AVX-512 명령어를 활용해 터너리 가중치 연산에서 부동소수점 곱셈을 제거함으로써 CPU 환경의 LLM 추론 성능을 획기적으로 개선한다.
구글이 제미나이 AI를 핵심으로 설계한 안드로이드 기반의 새로운 노트북 라인업인 구글북을 발표했다.
Meta가 Threads 게시물 내에서 Meta AI를 직접 언급하여 실시간 정보와 트렌드 맥락을 제공받는 기능을 5개국에서 베타 테스트 중이다.
Anthropic이 법률 분야 특화 서비스인 'Claude for Legal'에 문서 관리 및 판례 검색 시스템 연동을 위한 새로운 플러그인과 MCP 커넥터를 추가했습니다.
할리우드 배우들과 제작자들이 AI 시스템의 초상권 및 창작물 사용 여부와 비용을 직접 결정할 수 있는 '인간 동의 표준(Human Consent Standard)'을 도입했다.
슬랙 채널에서 Claude Code를 연동하여 코드베이스 분석, 브랜치 생성, 코드 작성 및 GitHub PR 생성을 자동화하는 설정 방법과 실전 활용법을 다룹니다.
LLM의 철학, 추론, RAG 등 다양한 연구 주제를 905개의 인사이트와 5902개의 연결 고리로 시각화한 지식 그래프입니다.
ChatGPT는 학습 데이터 양이 압도적인 파이썬보다 문법적 일관성과 간결성이 뛰어난 줄리아 언어에서 더 높은 코드 생성 성공률과 정확도를 보였다.
Claude Opus가 설계한 Laze는 LLM의 코드 생성 효율과 정확도를 극대화하기 위해 구두점을 최소화하고 C로 컴파일되는 네이티브 언어입니다.
디자인 스타트업 Dessn이 코드베이스를 클라우드에서 직접 실행하고 AI 프롬프트로 UI를 수정할 수 있는 도구를 개발하여 600만 달러의 시드 투자를 유치했다.
아마존 직원들이 AI 기술 활용도를 높게 평가받기 위해 내부 도구 'MeshClaw'를 활용해 불필요한 작업까지 자동화하며 토큰 사용량을 인위적으로 늘리고 있다.
상용 LLM API 게이트웨이에서 발생하는 무음 실패를 탐지하고 암호학적으로 증명하는 오픈소스 감사 프레임워크 Silent-Bench가 공개됐다.
프로덕션 환경에서 LLM 애플리케이션의 성능, 비용, 품질을 모니터링하고 디버깅하기 위한 7가지 주요 관측성(Observability) 도구의 특징과 선택 기준을 제시한다.
AI 음성 인프라 스타트업 Vapi가 아마존 링의 전량 도입 성과를 바탕으로 5억 달러 가치를 인정받으며 5,000만 달러 규모의 시리즈 B 투자를 유치했다.
AI 에이전트의 신뢰성과 확장성을 확보하기 위해 메모리, 도구, 보안을 관리하는 전용 운영체제(Agent OS) 아키텍처의 필요성을 제시한다.
Git의 interactive rebase 개념을 LLM 세션에 도입하여 대화 기록을 선택적으로 유지, 요약, 삭제할 수 있는 히스토리 관리 도구이다.
tmux와 at 명령어를 조합하여 Claude의 사용량 제한이 해제되는 시점에 맞춰 자동으로 작업을 재개하는 쉘 스크립트 팁이다.
MCP를 통해 Claude와 로컬 Ollama(Qwen 2.5 Coder)를 연결하여 고비용 작업을 로컬 모델에 위임하는 하이브리드 에이전트 시스템 구축 사례이다.
Figma 디자인 위에 색상 박스를 그려 Claude에게 좌표를 추출하게 함으로써 복잡한 레이아웃 엔진 코딩 없이 앱 템플릿 시스템을 구축한 사례이다.
LLM 도입 이후 과학 논문 내 존재하지 않는 가짜 인용문이 급증했으며, 이는 지식 생산의 신뢰성과 공정성을 훼손하고 있다.
Claude Code 사용 시 발생할 수 있는 보안 리스크를 방지하기 위해 도구 접근 권한과 파일 시스템 범위를 명시적으로 제한해야 한다.
여러 코딩 에이전트의 작업 상태와 오류를 실시간 음성 내레이션으로 중계하여 개발자의 모니터링 부담을 줄여주는 Mac용 오픈소스 도구이다.
AI 챗봇 사용자의 폭력적 성향을 감지하지 못한 OpenAI 등 AI 기업들을 대상으로 한 '경고 의무' 위반 소송이 잇따르고 있다.
Claude Code 기반의 다중 에이전트 시스템을 구축하여 B2B 영업 리드 수집부터 스코어링, CRM 연동까지 전 과정을 자동화했다.
전통적인 MLOps가 모델 학습과 예측 품질에 집중했다면, LLMOps는 프롬프트, 검색 파이프라인, 에이전트 조율 등 모델 주변 시스템 최적화에 초점을 맞춘다.
로컬 또는 사설망의 LLM을 외부 포트 개방 없이 공용 인터넷에 연결하고, 토큰 공유를 통해 크레딧을 적립·사용할 수 있는 P2P 프록시 시스템입니다.
정규 표현식의 등가성 결정 및 최소화라는 PSPACE-완전 문제를 활용하여 LLM과 LRM의 공간적 계산 한계와 추론 능력을 측정하는 RegexPSPACE 벤치마크가 제안됐다.
Claude Code 세션을 다중 운영자가 협업하고 원격 제어할 수 있는 공개 에이전트로 확장하는 레이어를 개발했다.
오디오 품질 저하로 깨진 전사 텍스트를 화자의 말투와 의도를 유지하며 복원하기 위한 구체적인 시스템 프롬프트와 가이드라인이다.
Claude Code를 활용해 비서, 변호사, 조사관 등 6가지 전문 역할을 수행하고 상호 컨텍스트를 공유하는 자율형 AI 에이전트 시스템 구축 사례이다.
Claude Sonnet 4.5의 구독 서비스 종료 전 'Extended Thinking'이 활성화된 빈 대화창을 대량 생성하여 사용 기간을 연장하는 우회 방법을 공유했다.
Graft는 SQLite와 llama.cpp를 기반으로 AI 에이전트에게 세션 간 유지되는 영구적인 그래프 구조의 메모리를 제공하는 로컬 퍼스트 오픈소스 도구입니다.
Hugging Face의 Nouamane Tazi가 수천 개의 GPU 클러스터에서 대규모 언어 모델을 효율적으로 학습시키기 위한 5D 병렬 처리 기법과 MoE 아키텍처의 확장 전략을 상세히 설명합니다.
NVIDIA와 Mistral AI의 연구를 바탕으로 LLM 사전 학습 시 데이터의 순서 최적화, 추론 데이터의 조기 주입, 그리고 강화 학습 기반 목적 함수가 모델 지능에 미치는 영향을 다룹니다.
확산 모델의 백본 아키텍처가 U-Net에서 Transformer(DiT)로 진화하는 과정과 그 내부 작동 원리 및 최적화 기법을 심도 있게 다룹니다.
OpenAI가 Codex Security 에이전트와 GPT-5.5-Cyber 모델을 결합하여 조직의 코드 취약점을 자동으로 탐지하고 패치하는 보안 이니셔티브 'Daybreak'를 발표했습니다.
기존 월드 모델은 고비용의 비디오 생성에 의존하여 연산 부담이 크고 환각 현상에 취약했다. 이 논문은 픽셀 대신 DINO 특징의 잔차를 활용한 RLA 기법을 통해 연산 효율을 극대화하면서도 복잡한 3D 환경에서 정확한 물리적 예측과 정책 학습이 가능함을 입증했다.
연속 혈당 측정(CGM) 데이터는 기기나 측정 환경에 따라 데이터 형태가 달라져 범용적인 분석 모델을 만들기 어려웠다. 이 논문은 원시 데이터를 복원하는 대신 추상적인 특징을 예측하는 JEPA 구조를 도입하여, 병원 검사 결과와 가정용 센서 데이터 간의 격차를 줄이고 인슐린 저항성 등 대사 질환의 조기 진단 가능성을 높였다.
기존 양자 시퀀스 모델은 하드웨어의 잡음과 확장성 문제로 긴 데이터를 처리하기 어려웠다. 이 논문은 단일 큐비트 기반의 QKAN과 게이트 메커니즘을 결합하여, 훨씬 적은 파라미터로도 기존 LSTM보다 정확한 예측 성능을 보여주며 실제 양자 컴퓨터에서도 동작 가능함을 입증했다.
LLM 에이전트가 복잡한 도구 사용 작업을 수행할 때, 작업이 완전히 끝난 뒤에야 실패를 확인하면 이미 돌이킬 수 없는 손실이 발생할 수 있다. 이 논문은 에이전트의 실행 기록(Trace)을 실시간으로 분석하여 실패 가능성을 미리 경고함으로써 조기에 개입할 수 있는 실용적인 모니터링 기술을 제공한다.