2026년 3월 30일 AI 뉴스

Rust 프로젝트가 LLM 생성 코드의 무분별한 기여를 막기 위해 도입하는 새로운 정책

Rust 프로젝트가 LLM을 활용한 저품질 기여(slop)를 방지하고, 프로젝트 내 LLM 사용 범위를 명확히 규정하는 정책을 제안함.

Simon Willison

코딩 에이전트 덕분에 이제 언어와 프레임워크는 '락인'이 아니다

코딩 에이전트의 발전으로 인해 기존 코드베이스의 마이그레이션 비용이 낮아지면서, 특정 기술 스택에 종속되는 '락인' 현상이 점차 사라지고 있다.

LLM 스트리밍에 최적화된 증분 파싱 지원 TypeScript 마크다운 파서

LLM의 실시간 스트리밍 출력을 처리하기 위해 CommonMark와 GFM을 지원하는 증분 파싱 기반의 TypeScript 마크다운 파서입니다.

Latent Space (swyx)

의사의 행정 업무를 10~20시간 줄이는 Abridge의 임상 지능 레이어

Abridge는 환자와 의사의 대화를 실시간으로 분석하여 임상 노트를 자동 생성하고, 사전 승인 및 임상 의사결정을 지원하는 헬스케어 AI 플랫폼을 구축한다.

Salesforce

AI 에이전트 도입 전 필수 체크: 오케스트레이션 밀도 프레임워크 활용법

워크플로의 추론 복잡도를 측정하는 오케스트레이션 밀도 프레임워크를 통해 AI 에이전트와 결정론적 자동화 중 적합한 아키텍처를 선택하는 기준을 제시한다.

Databricks Blog Libraries

일론 머스크의 SpaceXAI, 핵심 인재 50명 이상 이탈하며 모델 개발 차질 우려

일론 머스크의 SpaceXAI에서 최근 50명 이상의 핵심 연구원과 엔지니어가 퇴사하며 모델 개발 역량에 대한 우려가 제기되고 있다.

Databricks Unity Catalog, 외부 엔진에서 관리형 테이블 직접 제어 가능해져

Databricks Unity Catalog가 관리형 Delta 테이블에 대한 외부 엔진 접근을 베타로 지원하고, Credential Vending 기능을 정식 출시했다.

Unity Catalog

Wired AI

AI 학습을 위해 직원들의 화면을 몰래 기록하는 Meta의 감시 정책

Meta가 AI 에이전트 학습 데이터를 수집하기 위해 직원들의 화면 활동을 추적하는 'Model Capability Initiative'를 도입하여 내부 반발과 노조 결성 움직임이 일고 있다.

The Verge AI Products Coding Agents

리처드 소처가 설립한 Recursive Superintelligence, 재귀적 자기 개선 AI로 연구 자동화 도전

리처드 소처가 설립한 Recursive Superintelligence가 재귀적 자기 개선 AI 모델 개발을 위해 6억 5천만 달러를 확보했다.

이제 스마트폰으로 PC를 제어한다: OpenAI, 모바일 ChatGPT에 Codex 연동 기능 추가

OpenAI가 데스크톱 코딩 에이전트인 Codex를 모바일 ChatGPT 앱에서 원격으로 제어하고 관리할 수 있는 기능을 출시했다.

ChatGPTCodexOpenAI

Kili Technology Blog

LLM 성능이 실제 서비스에서 안 나오는 이유? 맞춤형 벤치마크 구축 5단계 전략

프로덕션 환경의 LLM 시스템 신뢰성을 확보하기 위해 실제 실패 사례 기반의 맞춤형 벤치마크를 구축하고 운영하는 5단계 방법론을 제시한다.

Wired AI

머스크와 알트만의 법정 공방, 그리고 트럼프의 중국행이 의미하는 것

Wired의 Uncanny Valley 팟캐스트가 머스크와 알트만의 법정 공방, 트럼프의 중국 방문, 그리고 한타바이러스 관련 음모론을 다룹니다.

Hugging Face Blog

97M 파라미터로 SOTA 달성: IBM의 새로운 다국어 임베딩 모델 R2 공개

IBM이 200개 이상의 언어와 32K 컨텍스트를 지원하는 고성능 다국어 임베딩 모델 Granite R2(97M, 311M)를 Apache 2.0 라이선스로 공개했다.

The Verge AI Coding Agents Companies

Microsoft, 내부 개발자 대상 Claude Code 라이선스 전면 중단

Microsoft가 내부 개발자들의 Claude Code 사용을 중단하고 GitHub Copilot CLI로 통합한다.

Claude CodeMicrosoft

Cursor

Shopify의 플래시 세일 트래픽을 견뎌낸 데이터베이스 엔지니어링의 비밀

Shopify의 인프라 확장 경험과 데이터베이스 엔지니어링 철학, 그리고 AI 시대의 엔지니어링에 대한 심도 있는 대담.

Salesforce Engineering Blog Products

100명 이상의 엔지니어가 공존하는 Salesforce의 멀티 테넌트 AI 에이전트 플랫폼 'BYOP'

Salesforce는 모놀리식 플래너의 병목 현상을 해결하기 위해 독립적인 추론 엔진을 지원하는 멀티 테넌트 AI 에이전트 플랫폼 'BYOP'를 구축하여 개발 자율성과 확장성을 확보했다.

Agentforce

AWS ML Blog

Amazon Quick에서 여러 AWS 계정의 Athena 데이터를 쿼리하고 비용을 분리하는 방법

Amazon Quick의 교차 계정 Athena 액세스 기능을 사용하여 중앙 BI 계정에서 분산된 데이터를 쿼리하고 비용을 각 계정별로 청구한다.

AWS ML Blog Libraries Language Models

Stream Vision Agents와 Amazon Nova 2 Sonic으로 실시간 음성 에이전트 구축하기

Stream의 Vision Agents 프레임워크와 Amazon Nova 2 Sonic을 결합하여 지연 시간이 짧고 자연스러운 실시간 음성 AI 에이전트를 구축하는 방법을 제시한다.

Amazon BedrockAmazon Nova 2 SonicVision Agents

WRITER Companies

단순 챗봇을 넘어 업무를 직접 수행하는 AI 에이전트의 실무 적용

Writer가 공개한 AI 에이전트 기능은 콘텐츠 초안 작성부터 워드프레스 게시, 프로젝트 관리 툴 연동까지 전체 워크플로를 자동화한다.

Writer

Chris Raroque Coding Agents Dev Tools

AI 코딩 에이전트로 개발 생산성을 극대화하는 실전 워크플로우

Claude Code, Cursor, Greptile 등 AI 도구를 조합하여 테스트 자동화, 코드 리뷰, 원격 제어를 구현하는 개발 워크플로우를 공유한다.

Claude CodeCursorGreptile

Alignment Forum

AI가 평가 중임을 알아채는 이유: Safe-to-Dangerous Shift의 위험성

AI 정렬 평가 환경은 안전해야 하지만 실제 배포 환경은 위험을 수반하므로, 모델이 이를 구분해 평가를 우회하는 '정렬 위장' 문제가 발생한다.

Ars Technica AI

정부 승인 AI 의료 기록 도구, 환자 진료에 치명적 오류 가능성 확인

온타리오 감사관의 조사 결과, 정부가 승인한 20개 AI 의료 기록 보조 도구 모두에서 환각 및 정보 누락 등 심각한 정확도 문제가 발견됐다.

Techpresso

Apple의 앱 스토어 AI 에이전트 도입과 Anthropic의 B2B 시장 점유율 역전

Apple이 앱 스토어 내 AI 에이전트 도입을 준비 중이며, Anthropic이 B2B AI 시장에서 OpenAI의 점유율을 추월했다.

r/artificial

AI 에이전트 확산이 초래한 비용 폭주와 보안 위기: 현장의 경고

AI 에이전트 배포 가속화에 따른 비용 관리 실패, 보안 취약점, 그리고 인프라 규제 문제를 다룬 분석.

Partnership on AI

기업의 AI 도입 리스크를 관리하는 실전 가이드: PAI의 AI 위험 평가 프레임워크

Partnership on AI가 기업 차원에서 AI 도입 리스크를 식별하고 관리할 수 있도록 돕는 실무 중심의 '기업 AI 위험 평가 프레임워크' 초안을 공개했다.

Amazon Science

잘 만든 프롬프트도 더 개선할 수 있다, 자동화된 프롬프트 최적화 도구 Promptimus

Amazon Science가 기존의 잘 설계된 프롬프트를 모델별 특성에 맞춰 자동으로 정교하게 개선하는 방법론인 Promptimus를 공개했다.

AI Engineer

서버와 의존성 없이 AI 에이전트를 구성하는 이벤트 기반 아키텍처

상태, 리듀서, 후크로 구성된 이벤트 로그 기반의 AI 에이전트 아키텍처와 동적 워커 설정 방식을 다룸.

KDNugget

Python itertools로 시계열 피처 엔지니어링 효율 극대화하기

Python의 itertools 모듈을 사용하여 시계열 데이터의 지연, 롤링 윈도우, 계절성 피처를 효율적으로 생성하는 방법.

Ben's Bites

화면 녹화로 AI 에이전트에게 피드백을 전달하는 새로운 워크플로

화면 녹화 영상을 AI 에이전트에게 전달하여 구조화된 HTML 피드백 보고서와 작업 목록을 생성하는 워크플로를 제안한다.

KDNugget

에이전트 워크플로를 위한 5가지 소형 오픈 웨이트 언어 모델 분석

도구 호출 기능을 지원하는 5가지 경량 오픈 웨이트 언어 모델의 특징과 활용 사례를 정리함.

Salesforce

기업 운영의 AI 전환, 3단계 단계별 진화 전략으로 성공하기

기업 운영 프로세스를 AI 에이전트 기반으로 전환하기 위한 3단계 단계별 진화 모델과 7단계 실행 전략을 제시한다.

iMerit Blog Datasets

의료 AI 모델 성능을 결정짓는 2026년 필수 학습 데이터셋 12가지

의료 AI 모델의 정확도와 임상적 일반화 성능을 높이기 위해 활용할 수 있는 12가지 주요 의료 데이터셋과 각 데이터의 특징 및 활용 사례를 정리했다.

MIMIC-CXR

Practical AI

AI 전문가 국회의원이 진단하는 AI 규제, 일자리 변화, 그리고 실존적 위험

AI 전문가이자 국회의원인 Don Beyer가 AI 규제, 사이버 보안, 일자리 변화 및 실존적 위험에 대한 정치적·기술적 관점을 공유한다.

sudoremove

코드 한 줄 안 쓰고 AI 에이전트로 웹사이트 기능을 구현하는 법

OpenAI Codex CLI와 oh-my-codex(OMX)를 사용하여 팟캐스트 아카이브 페이지를 자동화하고 개발하는 실전 워크플로를 소개한다.

Krish Naik

AI/ML 엔지니어 취업을 위한 필수 기술 스택과 실무 역량 완벽 정리

AI/ML 엔지니어 채용 시장에서 요구하는 핵심 기술 스택, 인프라 운영 능력, 그리고 실무 마인드셋을 상세히 분석한다.

AI21 Labs

Jupyter Notebook은 끝났다: AI 에이전트가 바꾸는 새로운 학습의 미래

DeepLearning.AI의 Ryan Keenan이 기존 온라인 강의의 한계를 지적하며, AI 음성 에이전트와 대화형 인터페이스를 활용한 새로운 개인화 학습 플랫폼 'CodeDream'을 소개한다.

Allen Institute for AI (AI2)

AI 에이전트의 모든 토큰과 도구 호출을 실시간으로 추적하고 자동으로 버그를 수정하는 로컬 디버거, Raindrop Workshop

Raindrop Workshop은 AI 에이전트의 실행 과정을 실시간으로 추적하고, MCP를 통해 Claude Code와 연동하여 자동으로 버그를 진단하고 수정하는 오픈소스 로컬 디버거입니다.

Science Daily AI

당신의 '음'과 '어'가 치매의 신호일 수 있습니다: AI 음성 분석의 가능성

AI를 활용해 일상 대화 속 음성 패턴을 분석함으로써 치매와 같은 인지 기능 저하를 조기에 예측할 수 있는 가능성이 확인됐다.

Science Daily AI

슈퍼컴퓨터도 포기한 '불가능한' 양자 물질 문제, 텐서 네트워크로 초고속 해결

Aalto 대학 연구진이 텐서 네트워크를 활용해 기존 슈퍼컴퓨터로 시뮬레이션이 불가능했던 복잡한 준결정 구조를 즉각적으로 계산하는 양자 영감 알고리즘을 개발했다.

Cognition

Devin이 안드로이드 에뮬레이터를 실행해 모바일 앱을 직접 테스트합니다

AI 코딩 에이전트 Devin이 안드로이드 가상 장치(AVD)를 지원하여 모바일 애플리케이션의 빌드, 실행, 테스트 과정을 자율적으로 수행합니다.

AI 기후 모델의 성능을 검증할 표준이 필요하다: AIMIP 프로젝트 공개

AI 기후 모델의 성능을 표준화된 방식으로 평가하기 위해 AI2가 주도하는 AIMIP 프로젝트와 첫 번째 벤치마크 데이터셋을 공개했다.

Techpresso

OpenAI의 사이버 보안 프로젝트 Daybreak 출시와 Amazon의 AI 토큰 사용 강제 논란

eBay가 GameStop의 인수 제안을 거절하고, OpenAI는 사이버 보안 프로젝트 Daybreak를 공개하며 보안 시장 경쟁을 본격화했다.

Product Hunt Dev Tools

시각적 인터페이스로 AI 워크플로와 쇼핑 어시스턴트를 구축하는 Pipecat

Pipecat은 개발자를 위한 시각적 AI 워크플로 빌더와 이커머스용 AI 쇼핑 어시스턴트 기능을 제공하는 플랫폼이다.

Pipecat

비디오 분석 비용 90% 절감, 물리적 법칙까지 이해하는 Perceptron Mk1 공개

Perceptron이 물리적 인과관계와 객체 역학을 추론하는 비디오 분석 모델 Mk1을 기존 대비 90% 저렴한 비용으로 출시했다.

TLDR AI Feed Image Gen

텍스트 렌더링과 편집 성능을 강화한 Qwen-Image-2.0 공개

Qwen-Image-2.0은 Qwen3-VL을 인코더로 활용하고 멀티모달 Diffusion Transformer를 결합하여 텍스트 렌더링과 이미지 편집 성능을 높인 생성 모델이다.

Qwen-Image-2.0

Zapier Blog

복잡한 워크플로를 자동화할 최고의 AI 에이전트 빌더 6선

기업의 워크플로를 자동화하고 앱 스택 전반에서 에이전트를 운영할 수 있는 최적의 AI 에이전트 빌더 소프트웨어를 선정하고 각 도구의 강점과 적합한 사용 사례를 분석한다.

Zapier Blog

Google Forms 응답을 ChatGPT로 자동 분석하고 맞춤형 답장까지 생성하기

Zapier를 활용해 Google Forms 응답을 ChatGPT로 자동 분석하고 Gmail 초안 생성이나 팀 알림을 자동화하는 워크플로 구축 가이드.

Cursor Blog

Cursor, 멀티 리포지토리 지원하는 클라우드 에이전트 개발 환경 출시

Cursor가 멀티 리포지토리 지원, Docker 기반 환경 설정, 보안 및 거버넌스 기능을 강화한 클라우드 에이전트 개발 환경을 업데이트했다.

Stackoverflow

AI 코딩 속도에 가려진 위험, CATS 프레임워크로 안전하게 관리하기

AI 생성 코드가 가져오는 '정확성의 환상'을 방지하고, CATS(계약, 자동 검증, 텔레메트리, 단순화) 프레임워크를 통해 지속 가능한 개발 속도를 확보하는 방법을 제시합니다.

Simon Willison

llm CLI, OpenAI 최신 모델의 추론 토큰 표시 및 엔드포인트 지원 업데이트

llm CLI 0.32a2 버전이 OpenAI 최신 모델의 추론 토큰 표시와 /v1/responses 엔드포인트 지원을 추가했습니다.

Anthropic News

소상공인 업무 자동화의 시작, Anthropic이 선보이는 'Claude for Small Business'

Anthropic이 QuickBooks, PayPal 등 주요 비즈니스 도구와 연동하여 급여 관리, 마케팅, 회계 업무를 자동화하는 'Claude for Small Business'를 출시했다.

UiPath Blog

기업의 LLM 도입, 유연성과 거버넌스의 균형이 핵심이다

기업이 소프트웨어 테스트에 LLM을 효과적으로 도입하려면 유연한 모델 선택권과 엄격한 거버넌스 체계를 동시에 구축해야 한다.

NVIDIA AI Blog

Hermes Agent와 Qwen 3.6으로 구현하는 고성능 로컬 AI 에이전트

Hermes Agent와 Qwen 3.6 모델을 NVIDIA 하드웨어에서 구동하여 로컬 환경에서 효율적인 에이전트 워크플로를 구축한다.

Anyscale Blog

GPU 활용률 50% 미만인 이유: 멀티모달 데이터 파이프라인 최적화 전략

멀티모달 데이터 처리 시 CPU 병목으로 인한 GPU 유휴 문제를 해결하기 위해 Ray Data의 분리형 스트리밍 아키텍처를 활용하여 처리량을 최대 12배 향상한다.

The AI Daily Brief

직원들의 AI 사용량을 측정하는 '토큰맥싱', 과연 생산성 향상의 지표일까?

기업들이 직원들의 AI 토큰 사용량을 성과 지표로 활용하는 '토큰맥싱' 현상과 그에 따른 실무적 부작용을 분석합니다.

TechCrunch AI Coding Agents

멕시코 수자원 시설 공격에 사용된 Claude와 GPT, 사이버 공격의 진입 장벽을 낮추다

사이버 보안 기업 Dragos가 멕시코 수자원 시설을 대상으로 한 사이버 공격에 Anthropic의 Claude와 OpenAI의 GPT 모델이 악용된 사례를 보고했다.

내 책상 위의 AI 타마고치? Claude Code 사용량을 시각화하는 'Clawdmeter'

Claude Code의 토큰 사용량을 실시간으로 모니터링하고 시각화하는 오픈소스 하드웨어 대시보드 'Clawdmeter'가 공개됐다.

Claude Code

AWS ML Blog Products Companies

AI 에이전트 보안 강화: Amazon Bedrock AgentCore에서 Chrome 정책과 루트 CA 적용하기

Amazon Bedrock AgentCore는 Chrome 엔터프라이즈 정책과 루트 CA 인증서 지원을 통해 AI 에이전트의 브라우저 수준 보안 제어와 내부망 연결을 지원합니다.

Amazon Bedrock AgentCoreAWSChrome

AWS ML Blog

LLM 기반 Amazon Lex Assisted NLU로 챗봇 의도 분류와 슬롯 추출 정확도 높이기

Amazon Lex Assisted NLU는 LLM을 활용해 챗봇의 의도 분류와 슬롯 추출 정확도를 높이고, 수동 설정 없이도 자연스러운 대화 처리를 지원한다.

The Verge AI Companies

우리 동네 데이터 센터는 어디에? AI 인프라 투명성을 높이는 인터랙티브 지도

AI 데이터 센터의 위치와 관련 정책을 시각화하여 지역 주민의 알 권리와 협상력을 높이는 인터랙티브 지도가 공개되었다.

Google

최신 AI 모델 벤치마크 순위: Gemini 3.1 Pro가 1위 차지

다양한 AI 모델의 Visual Score 기반 벤치마크 순위에서 Gemini 3.1 Pro가 1위를 기록했다.

AI Engineer Products MLOps

SQL 없이 에이전트가 직접 쿼리하는 AI 네이티브 데이터베이스, BlitzGraph

BlitzGraph는 SQL 대신 타입이 지정된 JSON 쿼리(BQL)를 사용하여 AI 에이전트가 데이터와 직접 상호작용하도록 설계된 AI 네이티브 백엔드입니다.

TechCrunch AI Companies

AI 칩 제조사 Cerebras, 564억 달러 기업 가치로 화려한 IPO 데뷔

AI 칩 설계 기업 Cerebras가 IPO를 통해 55억 달러를 조달하며 564억 달러의 기업 가치를 기록했다.

Cerebras

에이전트 드리프트 방지: Microsoft Foundry의 자동화된 평가와 최적화 전략

Microsoft Foundry를 활용해 에이전트 드리프트를 감지하고, OpenTelemetry 기반 관측성과 자동화된 평가로 에이전트 성능을 최적화하는 방법을 다룬다.

Microsoft FoundryOpenTelemetry

The Verge AI

미국인 71%가 AI 데이터 센터 건설을 반대하는 이유

미국인 71%가 지역 내 AI 데이터 센터 건설에 반대하며, 주요 원인으로 전력 및 물 소비 문제를 지목했다.

d-Matrix Blog Coding Agents Dev Tools

GPU 병목을 해결하는 AI 코딩 에이전트의 새로운 인프라 전략

AI 코딩 에이전트의 급증하는 수요를 충족하기 위해 이기종 및 분산형 파이프라인을 활용하여 GPU 병목을 해결하고 추론 효율성을 높이는 전략.

Claude CodeCursord-Matrix

LLM은 누구에게 더 불친절한가? 취약 계층 대상 성능 저하 연구

LLM이 영어 숙련도, 교육 수준, 출신 국가에 따라 특정 사용자 그룹에게 더 낮은 정확도와 신뢰성을 보인다는 연구 결과.

LLM 컨텍스트 비용 90% 절감, ctx-opt로 구현하는 지능형 최적화

LLM 호출 전 메시지 배열을 자동으로 트리밍하거나 요약하여 토큰 예산을 관리하는 프레임워크 독립적 미들웨어 라이브러리.

Analytics Vidhya Companies

사진 마켓플레이스에서 AI 데이터 공급사로, Wirestock의 2,300만 달러 투자 유치

Wirestock이 사진 마켓플레이스에서 AI 데이터 공급 기업으로 전환하며 2,300만 달러의 시리즈 A 투자를 유치했다.

TechCrunch AI Companies

실적 호조에도 4,000명 감원, Cisco가 AI에 올인하는 이유

Cisco가 AI 및 사이버 보안 투자 재원 마련을 위해 전체 인력의 5%인 4,000명을 감원한다.

Cisco

Wired AI Companies

AI가 만든 가짜 이미지에 속은 시계 팬들, Swatch와 AP의 Royal Pop 협업의 진실

AI로 생성된 가짜 이미지로 인해 발생한 기대와 실제 제품 간의 괴리를, 서드파티 제조사들이 어댑터를 통해 메우며 새로운 시장을 형성하고 있다.

Audemars PiguetSwatch

IBM Technology Companies

에이전트 AI가 실패하는 3가지 이유와 해결책

에이전트 AI 시스템에서 발생하는 무한 루프, 환각적 계획, 안전하지 않은 도구 사용의 원인과 설계적 해결 방안.

IBM

URL만 바꾸면 끝, 복잡한 AI 모델 구조를 한눈에 파악하는 hfviewer 활용법

Hugging Face 모델 URL의 도메인을 hfviewer.com으로 변경하여 복잡한 모델 아키텍처를 인터랙티브 그래프로 즉시 시각화하는 도구입니다.

Hugging Face

The Verge AI

코딩 몰라도 앱 만든다? AI가 촉발한 '개인용 소프트웨어' 혁명

AI 코딩 도구를 활용해 누구나 자신만의 맞춤형 소프트웨어를 개발하는 '바이브 코딩' 시대가 도래했다.

Latent Space (swyx)Companies Language Models

LLM 개발 시 Ruby가 TypeScript보다 토큰을 45% 적게 사용하는 이유

Ruby는 TypeScript나 Python보다 토큰 효율성이 뛰어나 LLM 컨텍스트 윈도우를 더 효과적으로 활용할 수 있으며, RSpec을 통한 검증과 일관된 생태계 덕분에 AI 개발에 최적화된 언어이다.

KT Cloud Companies

데이터센터의 새로운 일꾼, 피지컬 AI와 휴머노이드 도입 로드맵

피지컬 AI를 탑재한 휴머노이드를 데이터센터에 도입하여 고집적 환경의 운영 효율과 안전성을 단계적으로 확보하는 전략을 제시한다.

kt cloudNVIDIA

OpenAI Codex의 공세와 Anthropic의 Claude API 정책 변경이 가져온 개발자 생태계 변화

OpenAI의 Codex 엔터프라이즈 프로모션과 Anthropic의 Claude API 사용량 정책 변경이 개발자 도구 시장의 경쟁을 심화시키고 있다.

AnthropicClaudeCodex

Artificial Intelligence Weekly Companies

7,250억 달러의 AI 투자, 하지만 소비자는 AI를 거부하고 있다

AI 인프라에 막대한 자본이 투입되는 반면, 소비자 신뢰 하락과 플랫폼 내 AI 콘텐츠 거부 현상이 심화되며 AI 시장의 구조적 불균형이 커지고 있다.

Google

90배 더 큰 모델과 대등한 성능, 16배 빠른 AI 안전성 모더레이션 GLiGuard 공개

GLiGuard는 0.3B 파라미터의 인코더 기반 모델로, 기존 디코더 모델 대비 16배 빠른 속도와 대등한 안전성 모더레이션 성능을 제공한다.

하드웨어 관리 없는 서버리스 AI 워크스페이스, Mycelis 출시

Mycelis는 스마트 라우팅, RAG, MCP 에이전트 통합을 통해 서버 관리 없이 오픈소스 모델을 배포하고 운영할 수 있는 서버리스 AI 워크스페이스를 제공한다.

Docker 한 줄로 구축하는 오픈소스 AI 에이전트 플랫폼, Linchpin

Linchpin은 Docker 기반의 오픈소스 셀프 호스팅 런타임으로, 다양한 클라우드 및 로컬 모델을 지원하는 관리형 AI 에이전트 플랫폼을 제공한다.

AI 코딩 에이전트를 위한 PostHog 전용 CLI, BossHogg 공개

BossHogg은 AI 코딩 에이전트와 터미널 사용자가 PostHog의 분석 및 기능 플래그를 효율적으로 제어할 수 있도록 돕는 에이전트 중심 CLI 도구입니다.

TechCrunch AI Products Language Models

의존성 없는 30줄짜리 초경량 CLI 코딩 에이전트, mi

Node.js 내장 모듈만 사용하는 30줄 규모의 초경량 자율 코딩 에이전트 mi를 소개합니다.

구글 Gboard의 새로운 AI 받아쓰기 'Rambler', 음성 인식 시장 판도 바꿀까

구글이 Gboard에 Gemini 기반의 AI 음성 받아쓰기 기능인 Rambler를 도입하여 실시간 언어 전환과 문장 교정을 지원한다.

GboardGemini

메타, WhatsApp에서 대화 기록이 남지 않는 '시크릿 모드' AI 채팅 도입

메타가 WhatsApp과 Meta AI 앱에 대화 내용을 저장하지 않는 시크릿 모드 기능을 도입하여 사용자 프라이버시를 강화한다.

TLDR AI Feed Companies Language Models

검색 파이프라인을 대체할 에이전트 기반 검색 모델의 등장

기존의 복잡한 모놀리식 검색 파이프라인을 LLM 기반의 에이전트가 오케스트레이션하는 에이전트 기반 검색 모델로 대체하는 흐름과 그 필요성을 다룬다.

법률 업무 자동화를 위한 Claude for Legal: 실무 에이전트와 플러그인 가이드

Claude for Legal은 계약 검토, 실사, 규제 모니터링 등 다양한 법률 워크플로우를 자동화하는 AI 에이전트와 플러그인 모음입니다.

AnthropicClaude

4B 모델로 Claude Sonnet급 성능 달성: RLM과 RL 파인튜닝의 힘

RL fine-tuning을 통해 소형 4B 모델을 Recursive Language Model로 학습시켜, 대형 모델 수준의 성능과 낮은 추론 비용을 동시에 달성함.

20 토큰/파라미터 법칙은 틀렸다? 바이트 단위로 최적화하는 새로운 스케일링 법칙

기존의 토큰 기반 스케일링 법칙을 넘어, 바이트 단위의 정보 밀도를 고려한 컴퓨트 최적화 스케일링 법칙을 제시함.

Gemini 3.1을 증류한 26M 파라미터 초소형 모델, Needle 공개

Gemini 3.1을 기반으로 증류된 26M 파라미터의 초소형 함수 호출 특화 모델 Needle의 구조와 활용법을 정리한다.

문서 유지보수 자동화: 에이전트가 스스로 수정하고 검증하는 반복 루프 구축법

에이전트가 기술 문서를 검토, 수정, 검증하는 반복 루프를 통해 문서의 정확성을 유지하고 유지보수 비용을 절감하는 워크플로를 다룬다.