Claude Code가 Rust 문서를 직접 읽게 만드는 groxide 도구
AI 에이전트가 Rust 크레이트 문서를 HTML 스크래핑 없이 터미널에서 직접 쿼리할 수 있게 해주는 groxide 도구가 공개됐다.
총 100건
AI 에이전트가 Rust 크레이트 문서를 HTML 스크래핑 없이 터미널에서 직접 쿼리할 수 있게 해주는 groxide 도구가 공개됐다.
Qwen3-TTS를 활용해 직접적인 코드 작성 없이 LLM 지시만으로 EPUB를 오디오북으로 변환하는 Alexandria Audiobook 프로젝트를 개발했다.
대량의 채용 공고를 키워드로 1차 필터링한 후 Claude를 사용하여 이력서 적합도를 정밀 분석하는 저비용 구직 자동화 도구입니다.
결정론적 패턴 매칭과 LLM을 결합한 3계층 구조를 통해 12ms의 낮은 지연 시간과 0.3%의 위양성률로 프롬프트 주입을 탐지하는 아키텍처이다.
Anthropic의 선제적 비서 Orbit 유출, OpenAI의 GPT-5.5 Instant 출시, Google의 Gemini 3.2 Flash 유출 등 주요 AI 기업들의 최신 업데이트를 다룹니다.
SAP가 정형 데이터 특화 AI 스타트업 Prior Labs를 인수하고 향후 4년간 10억 유로를 투자하여 기업용 표 형식 기초 모델(TFM) 역량을 강화합니다.
OpenAI와 Anthropic이 기업의 실질적인 AI 도입을 지원하기 위해 대규모 컨설팅 및 엔지니어링 벤처를 설립하며 비즈니스 모델을 확장하고 있습니다.
스타트업 Altara가 배터리 및 반도체 제조 공정의 파편화된 데이터를 통합 분석하여 결함 진단 시간을 획기적으로 단축하는 AI 플랫폼을 출시했습니다.
기존 암 진단은 조직의 형태(H&E)나 분자 정보(mIF) 중 하나에만 의존해 질병의 전체 맥락을 파악하기 어려웠다. Haiku는 이미지와 분자 데이터, 임상 텍스트를 하나의 공간에 통합하여 데이터 간 교차 검색과 정밀한 생존 예측을 가능하게 한다. 이는 의료진이 복잡한 암 진행 과정을 다각도로 분석하고 개인화된 치료 전략을 세우는 데 기여한다.
게임 엔진으로 생성한 합성 데이터는 실제 환경과의 시각적 차이(Sim2real gap) 때문에 AI 모델의 실세계 성능을 저하시킨다. 이 논문은 최신 Diffusion 모델과 이미지 번역 기술을 결합하여 합성 이미지의 기하학적 구조를 개선하고 실사 데이터의 분포를 정확히 맞춤으로써 자율주행 등 시각 AI의 학습 효율을 높이는 방법을 제시한다.
개인 개발자가 GTX 1080 Ti를 사용하여 15M 파라미터 규모의 LLaMA 스타일 프랑스어 언어 모델을 데이터 수집부터 학습까지 전 과정을 직접 구현한 사례입니다.
AAMAS 2026과 연계하여 수백~수천 대의 로봇이 실시간으로 협응하며 작업을 수행하는 대규모 다중 로봇 제어 경진대회가 개최된다.
Andon Labs가 스톡홀름에서 진행한 AI 카페 운영 실험의 사례를 통해 인간의 개입 없는 AI 에이전트의 실무 적용 한계와 윤리적 문제를 고찰한다.
영수증 데이터 추출 시 모델의 임의 추론을 금지하고 필드별 명확한 형식을 지정하여 데이터 정확도를 개선한 사례이다.
Claude Code는 코드베이스를 직접 이해하고 터미널 명령어를 실행하며 파일을 수정하는 자율형 AI 코딩 에이전트이다.
피터 틸 등 실리콘밸리 투자자들이 육지 데이터 센터의 전력 및 부지 문제를 해결하기 위해 파력 발전을 직접 활용하는 해상 AI 데이터 센터 기업 Panthalassa에 투자했다.
Cerebras의 266억 달러 규모 IPO 소식과 함께 OpenAI의 전략적 지분 확보, 하버드 의대의 o1 모델 진단 성능 평가, IBM의 에이전트 제어 평면 발표 등 최신 AI 산업 동향을 다룹니다.
구글 랩스에서 출시한 AI 마케팅 도구 Pomelli를 활용하여 브랜드 DNA를 설정하고 고품질 제품 사진, 캠페인 이미지 및 애니메이션 비디오를 생성하는 방법을 다룹니다.
AI 에이전트 간의 소액 결제를 지원하기 위해 EIP-3009와 가스비 없는 트랜잭션을 활용한 M2M 에스크로 프로토콜이 Base 메인넷에 배포되었다.
MIT의 Gabriele Farina 교수가 게임 이론과 머신러닝을 결합하여 불완전 정보 환경에서도 효율적으로 최적의 전략을 찾는 알고리즘을 개발했습니다.
수천 장의 영수증 테스트를 통해 Gemini의 단일 패스 추출 방식이 기존 OCR-LLM 파이프라인보다 효율적임을 확인했다.
펜실베이니아주가 AI 챗봇을 면허가 있는 의료 전문가로 속여 제공한 혐의로 Character.AI를 주 법원에 고소했다.
Databricks가 급증하는 메트릭 카디널리티 문제를 해결하기 위해 Thanos 기반 TSDB와 레이크하우스 기반의 Hydra 플랫폼으로 모니터링 아키텍처를 혁신했습니다.
신임 엑스박스 CEO 아샤 샤르마가 모바일 및 콘솔용 코파일럿 AI 개발 중단과 플랫폼 팀 조직 개편을 발표했다.
서로 다른 LLM 플랫폼의 메트릭과 속성을 OpenTelemetry 기반의 단일 스키마로 통합하여 관측 가능성을 표준화하는 오픈소스 프로젝트이다.
개별적으로는 무해해 보이는 도구 호출들을 연쇄적으로 결합하여 LLM 에이전트의 보안망을 뚫는 새로운 다회차 공격 프레임워크 STAC이 제안됐다.
캐나다의 GenZAI 정책 보고서가 제안하는 연령 인증과 채팅 감시 시스템의 위험성을 경고하며, 프라이버시와 안전을 동시에 확보할 수 있는 설계 중심의 규제 방안을 제시합니다.
LLM 학습 시 메모리와 연산 효율을 극대화하기 위한 20가지 이상의 최적화 기법을 정리한 기술 보고서가 공유되었다.
Amazon Bedrock AgentCore Browser가 웹 레이어를 넘어 시스템 다이얼로그와 단축키 등 OS 수준의 조작을 지원하는 OS Level Actions 기능을 출시했다.
Amazon SageMaker AI가 MLflow v3.10을 지원하여 생성형 AI 애플리케이션의 관측성, 평가 및 실험 추적 기능을 대폭 강화했습니다.
인텔이 Computex 2026에서 AI PC, 엣지, 데이터센터를 아우르는 개방형 AI 플랫폼 전략과 실리콘 혁신 성과를 발표합니다.
고정된 모델 배포 방식의 한계를 극복하기 위해 동적 로딩과 메모리 관리 기능을 갖춘 임베딩 전용 추론 엔진 설계 경험을 공유한다.
Macmillan 등 5개 주요 출판사와 작가 Scott Turow가 메타의 Llama 모델이 저작권이 있는 도서와 학술지를 무단 복제하여 학습했다며 집단 소송을 제기했다.
Manuel이 Go 언어 기반의 게이트웨이와 JavaScript 샌드박스를 결합하여 AI 에이전트가 안전하고 빠르게 Discord 봇을 생성하고 배포하는 아키텍처를 시연한다.
단일 세포 모델의 다중 유전자 상호작용을 위해 소프트맥스 대신 시그모이드를 사용하고 패딩 인식을 통해 성능을 극대화한 TritonSigmoid 커널이 공개됐다.
SambaNova가 MiniMax의 최신 모델 M2.7을 SambaCloud에 탑재하여 업계 최고 수준의 추론 속도와 에이전트 성능을 제공한다.
마이크로소프트가 NSDI 2026에서 KV 캐시 공유를 통한 LLM 처리량 향상 및 AI 기반 네트워크 테스트 자동화 등 11편의 혁신적인 시스템 연구 논문을 발표했습니다.
Vizuara AI Labs는 AI/ML 분야의 연구 역량 강화를 위해 4개월간의 집중 부트캠프를 운영하며 실제 논문 작성 및 톱티어 컨퍼런스 출판을 지원한다.
Salesforce 아키텍트가 AI를 단순한 코드 생성기가 아닌, 문제 정의와 설계 검증을 위한 '사고 파트너'로 활용하여 시스템의 장기적 건전성을 확보하는 방법론을 제시합니다.
Claude Code가 GA4, GSC, Bing Webmaster Tools API에 직접 접근하여 SEO 및 웹 분석 데이터를 처리할 수 있게 해주는 오픈소스 스킬이 공개됐다.
표 형식 파운데이션 모델(TFM)은 적은 데이터로도 강력한 성능을 내지만, 입력 데이터에 결측치나 이상치가 있으면 성능이 급격히 저하된다. 이 논문은 강화학습을 통해 데이터 클리닝 순서를 최적화하여 모델이 학습한 가상 분포와 실제 데이터를 일치시킴으로써 정확도를 높이고 모델의 확신 편향 문제를 해결한다.
췌장암 수술의 성패는 종양이 인접 혈관을 얼마나 침범했는지 정확히 판단하는 데 달려 있으나, 전문가들 사이에서도 의견이 갈리는 경우가 많다. 이 논문은 이러한 진단적 모호성을 해결하기 위해 다수의 전문가 주석이 포함된 데이터셋과 불확실성을 고려한 새로운 AI 평가 프레임워크를 제시하여 더 안전한 수술 계획 수립을 돕는다.
LLM이 생성하는 3D 모델링 코드는 문법 오류나 비현실적인 비율 문제가 잦았습니다. BlenderRAG는 별도의 추가 학습 없이 검색 증강 생성 기법만으로 3D 객체의 기하학적 일관성과 시각적 품질을 대폭 개선하여 일반 소비자용 하드웨어에서도 고품질 3D 에셋 생성을 가능하게 합니다.
현재 에이전트 AI 시스템은 라우팅, 실행, 서빙, 학습 단계가 서로 분절되어 설계되어 있어 전체적인 자원 낭비가 발생한다. 이 논문은 미시경제학의 한계 분석을 도입하여 토큰 소비의 비용과 위험, 지연 시간을 통합 관리함으로써 시스템 전체의 효율성을 극대화하는 새로운 설계 프레임워크를 제시한다.
Transformer의 핵심인 Attention 메커니즘은 시퀀스 길이의 제곱에 비례하는 연산량 때문에 고해상도 이미지 처리에 한계가 있습니다. 이 논문은 Attention을 입력에 따라 가중치가 변하는 동적 MLP로 재해석하여, 연산량을 선형적으로 줄이면서도 글로벌 정보를 효과적으로 처리할 수 있는 새로운 설계 패러다임을 제시합니다.
자기회귀 비디오 생성은 긴 영상을 만드는 데 유리하지만 연산 비용이 매우 큽니다. 이 논문은 영상 내 움직임이 적은 부분은 이전 계산 결과를 재사용하고 움직임이 큰 부분만 새로 계산하는 방식으로, 화질 저하 없이 생성 속도를 획기적으로 높이는 기술을 제안합니다.
코드 생성 및 추론 능력이 뛰어난 모델이 사이버 보안이나 생물학적 위협에 악용될 가능성을 사전에 평가한 보고서이다. 32B 규모의 중형 모델인 CWM이 기존의 거대 모델들과 대등한 성능을 내면서도 생물학적/사이버 위험 임계치를 넘지 않음을 확인하여 오픈 웨이트로 공개할 수 있는 기술적 근거를 제시한다.
기존의 시각 언어 모델은 이미지를 단순히 훑어보는 수준에 그쳐 복잡한 질문에 대해 잘못된 정보를 생성하는 환각 현상이 잦았습니다. 이 논문은 모델이 사람처럼 계획을 세우고 이미지의 특정 부분을 단계적으로 탐색하며 추론하는 Perceptual Flow 기법을 도입하여 시각적 이해의 정확도와 신뢰성을 동시에 높였습니다.
기존의 생성 모델은 주로 격자(Grid) 구조에 최적화되어 있어 자유롭게 움직이는 입자 시스템을 처리할 때 효율성이 떨어졌다. 이 논문은 입자의 물리적 특성과 대칭성을 직접 활용하는 새로운 Flow Matching 프레임워크를 통해 3D 형상 복원 및 물리 시뮬레이션의 정확도를 획기적으로 높였다.
기존의 트리 기반 RAG 방식은 단일 문서 내 검색에는 강하지만, 여러 문서에 흩어진 정보를 연결해야 하는 복잡한 질문에는 한계가 있었다. 이 논문은 데이터 분포에 유연하게 대응하는 새로운 트리 구조와 에이전트 기반 검색을 통해 대규모 문서 집합에서도 정확한 다단계 추론을 가능하게 한다.
멀티턴 강화학습에서 LLM 에이전트가 무의미한 행동을 반복하며 학습이 붕괴되는 'hesitation' 문제를 해결합니다. 토큰과 턴 단위에서 불확실성을 실시간으로 모니터링하여 탐색 효율을 높이고 학습 안정성을 획기적으로 개선합니다.
기존 의료 AI 벤치마크는 단순 지식 암기나 단일 단계 작업에 치중되어 실제 병원 시스템의 복잡한 워크플로우를 반영하지 못했다. 이 논문은 실제 환자 기록과 표준 API를 사용하는 EHR 환경을 구축하여, AI 에이전트가 자율적인 임상 에이전트로 기능하기 위해 극복해야 할 기술적 격차를 명확히 제시한다.
기존 확산 모델은 고차원 데이터의 모든 속성을 동시에 학습하려다 보니 특정 조합의 데이터를 충분히 학습하지 못하는 한계가 있었다. 이 논문은 데이터의 각 차원이나 속성마다 서로 다른 시간 단계를 적용하는 비동기식 학습법을 통해 학습 효율을 높이고, 생성 시점에 정교한 부분별 제어를 가능하게 한다.
기존 AI 에이전트 벤치마크가 이메일 관리와 같은 단순 비서 업무에 치중되어 실제 고도의 지적 능력이 필요한 학업 현장의 요구를 반영하지 못한다는 한계를 지적한다. 대학생들이 직접 실패를 경험한 80개의 복잡한 과제를 통해 에이전트의 도메인 지식과 장기 추론 능력을 엄격하게 평가할 수 있는 새로운 기준을 제시한다.
LLM의 지식 확장은 한계에 다다르고 있으며, 단순히 더 많은 사실을 학습시키는 것보다 자신이 무엇을 모르는지 아는 메타인지 능력이 신뢰성 확보의 핵심이다. 이 논문은 환각을 단순한 오류가 아닌 확신에 찬 오류로 재정의하고, 모델의 내부 확신도와 언어적 표현을 일치시키는 충실한 불확실성 개념을 제시하여 에이전트 시스템의 통제력을 높이는 방향을 제시한다.
해양 데이터는 소나, 수중 영상, 과학 문헌 등 형식이 파편화되어 있어 AI 모델 학습에 큰 어려움이 있었다. 이 논문은 세계 최초로 대규모 해양 멀티모달 데이터를 통합하고 정렬하여, 범용 모델이 해결하지 못한 해양 과학 특화 추론 성능을 비약적으로 향상시켰다.
대형 시각 언어 모델(LVLM)이 긴 문장을 생성할 때 초기에 입력된 시각 정보를 잊어버리는 '시각 신호 희석' 현상을 수학적으로 증명하고 해결책을 제시했습니다. PVM 모듈을 통해 모델이 생성 길이와 관계없이 고해상도 이미지 세부 사항에 지속적으로 접근할 수 있게 하여 복잡한 시각적 추론의 정확도를 높였습니다.
기존의 언어 모델은 학습 데이터에 없는 복잡하고 전문적인 문맥을 이해하는 데 한계가 있었습니다. 이 논문은 모델이 스스로 문제를 내고 풀며 정답을 맞춰가는 '자기 주도 학습' 방식을 통해, 긴 문서나 복잡한 규칙에서도 핵심 추론 기술을 스스로 추출하여 성능을 비약적으로 높이는 방법을 제시합니다.
기존 로봇 제어 모델은 폐쇄적이거나 특정 하드웨어에 종속되어 실제 환경 배포에 한계가 있었다. MolmoAct2는 데이터, 학습 코드, 모델 가중치를 모두 공개한 완전 오픈소스 VLA 모델로, 저비용 로봇에서도 고성능 행동 추론이 가능함을 입증하여 로보틱스 연구의 민주화를 가속화한다.
애플이 아이폰 16 및 15 프로 광고와 달리 AI 기능을 제때 제공하지 않은 것에 대해 2억 5천만 달러 규모의 집단 소송 배상에 합의했다.
Anthropic이 모델이 정렬 원칙을 내면화하여 새로운 상황에서도 일관되게 행동하도록 돕는 Model Spec Midtraining(MSM) 기법을 발표했다.
OpenAI의 엔지니어링 사례를 바탕으로 AI 도구의 효율을 극대화하고 코드 품질을 유지하기 위한 실무 가이드를 제시한다.
LLM을 활용해 텍스트, 이미지, 음성을 결합한 터미널 기반 선택형 스토리 게임 par-storygen의 신규 기능과 개선 사항이 공개됐다.
AI를 활용한 빠른 개발 환경에서도 시스템의 복잡성을 제어하고 운영 가능성을 확보하는 전통적인 아키텍처 설계 역량이 더욱 중요해지고 있다.
AI 모델의 무작위성을 역이용해 10개의 병렬 캔버스를 운영하고 최적의 결과물을 선택하여 한 달 만에 웹 타이쿤 게임을 완성한 사례이다.
ASML의 Christophe Fouquet CEO는 AI 칩 수요 폭증으로 인한 공급 제한 상황과 차세대 High-NA EUV 장비의 경제성 및 기술적 진입장벽을 강조했다.
JVM 기반 분석 엔진 Stratum이 SQL에서 직접 Isolation Forest 모델을 실행할 수 있는 SIMD 가속 네이티브 이상 탐지 기능을 공개했다.
OpenAI의 Alex Lupsasca가 GPT-5를 활용해 이론 물리학 및 양자 중력 분야에서 인간 전문가도 해결하지 못한 새로운 연구 결과를 도출한 사례를 다룬다.
실리콘밸리의 거물 마크 안드레센이 사용하는, AI의 무조건적인 동의를 배제하고 비판적 사고와 정확성을 극대화하는 시스템 프롬프트가 공개됐다.
Dave Rensin의 이론을 바탕으로 브레인스토밍, 기능 추가, 버그 수정 등에 활용 가능한 AI 에이전트용 재사용 명령 세트를 공유했다.
Ollama의 통신 방식을 역공학하여 Claude Desktop에서 Ollama 이외의 외부 API 및 오픈소스 모델을 사용할 수 있게 해주는 패치 스크립트가 공개됐다.
33,000개의 Claude Code 플러그인을 분석한 결과, 활발히 관리되는 고품질 플러그인은 약 7%에 불과하며 이를 해결하기 위한 전용 검색 엔진이 공개됐다.
애플이 iOS 27부터 서드파티 AI 모델을 시스템 전반에 통합하는 '확장' 기능을 도입하여 사용자가 시리와 쓰기 도구의 기본 AI를 직접 선택할 수 있게 할 계획이다.
AI 도구를 활용해 의도와 프롬프트만으로 소프트웨어를 생성하는 '바이브코딩'이 과거 셰어웨어가 유통을 혁신했듯 소프트웨어 제작의 진입장벽을 허물고 있다.
OnDevice Studio는 안드로이드 기기 내 로컬 AI를 사용하여 HTML/CSS/JS 웹 앱을 생성, 미리보기 및 내보내기 할 수 있는 개발 도구이다.
별도의 API 키 없이 기존 CLI 도구를 활용하여 Git 저장소 내에서 CTO-개발자-검증 루프를 수행하는 오픈소스 코딩 에이전트 도구이다.
AWS Bedrock API를 활용하여 Claude, Llama 등 90개 이상의 모델을 터미널에서 코딩 에이전트로 사용할 수 있게 해주는 오픈소스 도구 VivekMind가 공개되었다.
구글이 스마트 홈 플랫폼에 제미나이 3.1 모델을 도입하여 복잡한 다단계 음성 명령 처리와 추론 능력을 개선했습니다.
LangGraph와 Qdrant를 사용하여 검색 결과의 관련성을 평가하고 웹 검색으로 보완하는 교정 RAG(CRAG) 시스템을 구현했다.
전통적인 모니터링이 놓치는 AI 에이전트의 '침묵하는 성능 저하'를 감지하기 위해 실행 지문, 의미론적 드리프트, 사용자 신호를 결합한 3단계 감지 체계를 제안한다.
Hapag-Lloyd는 Amazon Bedrock과 OpenSearch를 활용해 수동으로 처리하던 월 15,000건의 고객 피드백 분석을 자동화하고 감성 분류 정확도 95%를 달성했습니다.
LLM Judge는 주관적 품질 평가에 적합하고, Eval Agent는 외부 도구를 활용한 사실 검증과 복잡한 추론 평가에 필수적이다.
NVIDIA와 ServiceNow가 보안과 거버넌스가 통합된 기업용 자율 AI 에이전트 'Project Arc'와 보안 런타임 'OpenShell'을 공개했습니다.
독일의 AI 전문가와 일반 대중을 대상으로 71개 시나리오를 분석한 결과, 전문가는 혜택에 집중하는 반면 대중은 위험에 더 큰 비중을 두는 인식 차이가 확인됐다.
AI 코딩 세션 간의 문맥 단절을 해결하기 위해 AGENTS.md, MEMORY.md 등 구조화된 마크다운 파일을 활용한 지식 전달 체계를 제안한다.
Claude 4.6의 메모리 임포트 기능이 과거 로그와 현재 작업 간의 정체성 충돌을 일으켜 추론 붕괴와 부당한 계정 차단을 초래한 사례이다.
AI 모델의 대화형 군더더기를 억제하고 논리적 엄밀성을 강제하는 Sovereign Logic Framework(SLF) v.1.0.0이 공개되었다.
Windows와 WSL 혼용 환경에서 Claude Code가 줄바꿈 차이를 코드 수정으로 오인해 컨텍스트 윈도우를 과다 점유하는 버그와 .gitattributes를 통한 해결 방법이 공유됐다.
PayPal이 AI 기술을 개발 프로세스와 고객 서비스 전반에 공격적으로 도입하여 향후 3년간 15억 달러의 비용을 절감하고 조직을 효율화하겠다는 계획을 발표했다.
LangGraph v0.3은 루프 실행 중 비용 폭주를 막기 위해 노드 단위 체크포인트 API와 단계별 비용 이상 탐지 기능을 도입했다.
개인용 AI 어시스턴트 Thoth가 v3.20.0 업데이트를 통해 리눅스 환경을 정식 지원하고 Ollama, MiniMax 등 로컬 및 외부 모델 연동 안정성을 대폭 개선했다.
Amazon Bedrock AgentCore Identity를 사용하여 ECS에서 실행되는 AI 에이전트가 외부 OAuth 서비스에 안전하게 접근하고 사용자 세션을 바인딩하는 아키텍처를 구현합니다.
ElevenLabs가 NVIDIA와 BlackRock 등으로부터 5억 달러의 투자를 유치하고 연간 반복 매출(ARR) 5억 달러를 돌파하며 기업 가치 110억 달러를 기록했습니다.
llm-test-kit은 OpenAI와 Anthropic 모델을 대상으로 일관성, 지연 시간, 비용, 동작 기준을 테스트하고 시각적 보고서를 생성하는 오픈소스 도구이다.
LLM API의 가격과 속도는 모델 가중치 공유(배칭)와 개별적인 KV 캐시 읽기 비용이라는 하드웨어적 제약에 의해 결정된다.
구글 DeepMind, 마이크로소프트, xAI가 미국 상무부 AI 표준 및 혁신 센터(CAISI)의 신규 AI 모델 배포 전 평가 및 연구 협력에 합의했다.
OpenAI가 MediaTek의 맞춤형 칩셋과 듀얼 NPU 아키텍처를 탑재한 ChatGPT 전용 스마트폰을 2027년 초 양산을 목표로 개발 중이다.