2026년 3월 18일 AI 뉴스 아카이브

GPU 비용 22% 절감, 응답 속도 85% 향상시키는 프레임워크 Ranvier

LLM 서빙 시 로드 밸런서가 토큰 접두사(Prefix)를 인식하여 동일한 KV 캐시를 보유한 GPU로 요청을 라우팅함으로써 추론 효율을 극대화하는 방법론을 제시한다.

r/vibecoding Companies Coding Agents

ChatGPT Images 2.0 출시 후 인도에서 폭발적 인기, 그 이유는?

OpenAI의 ChatGPT Images 2.0 출시 이후 인도가 최대 사용자 시장으로 부상했으며, 주로 개인적 자기표현과 다국어 텍스트 렌더링 기능이 활용되고 있다.

TWIML AI Podcast

AI 추론 엔지니어링: 연구 결과가 31시간 만에 프로덕션에 적용되는 이유

Base10의 Philip Kiely가 AI 추론 시스템의 복잡성과 연구에서 프로덕션으로 이어지는 급격한 속도, 그리고 추론 엔지니어링의 미래 전망을 공유합니다.

Claude Code가 짠 코드, 보안 점검도 같은 AI에게 맡겨도 될까?

Anthropic의 기업용 보안 도구 출시에 맞춰, AI 시스템 감사 과정에서 발견된 실제 보안 취약점 사례와 독립적 보안 검증의 필요성을 강조한다.

AnthropicClaude CodeLiteLLM

r/ClaudeCode Coding Agents Agents

Claude Code의 기억력 문제 해결, Slack 대화 기록을 메모리로 활용하는 법

Claude Code 에이전트가 Slack 스레드 기록을 검색하고 소환하여 협업 맥락을 유지할 수 있게 해주는 slack-recall 기술이 공개됐다.

Claude CodeMCP

r/ClaudeCode Agents

Claude Code가 내 과거 코드를 기억한다? 자동 메모리 주입 도구 Brainspike

Brainspike는 Claude Code 사용 시 다양한 메모리 계층에서 관련 정보를 검색하여 프롬프트에 자동으로 주입해주는 오픈소스 도구이다.

MCP

r/deeplearning Companies

DeepSeek-R1은 16억 달러인데 OpenAI는 왜 영리 전환이 필요했나?

OpenAI가 막대한 투자금에도 불구하고 영리 법인으로 전환한 것이 DeepSeek-R1의 저비용 성공 사례에 비추어 볼 때 기만적인 행위라는 비판이 제기되었다.

MicrosoftOpenAI

Scale AI

AI가 베테랑의 판단력을 배운다? Scale AI의 기업용 학습 시스템 Dialect

Scale AI가 기업 내부의 암묵적 지식과 전문가의 판단 로직을 데이터화하여 AI 에이전트가 지속적으로 학습하고 고도화될 수 있도록 지원하는 Dialect 시스템을 발표했습니다.

Simon Willison

OpenAI Codex CLI, 목표 달성할 때까지 스스로 반복하는 기능 탑재

OpenAI의 Codex CLI 0.128.0 버전이 설정된 목표를 달성하거나 예산이 소진될 때까지 작업을 반복 수행하는 /goal 기능을 도입했다.

Hugging Face Transformers가 지원하는 최신 양자화 기법 총정리

Hugging Face Transformers 라이브러리에서 지원하는 AWQ, GPTQ, bitsandbytes 등 다양한 양자화 알고리즘의 설정 클래스와 파라미터 상세 명세입니다.

Sony

인간을 이긴 탁구 로봇 Project Ace, Nature 표지 장식

Sony AI의 탁구 로봇 Project Ace가 Nature 표지를 장식하며 인간 전문가 수준의 물리적 AI 성능을 입증하고 칩 설계 및 오디오 생성 등 다양한 연구 성과를 공유했다.

r/LangChain Libraries

스키마 검증만으로는 부족한 AI 파이프라인의 신뢰도 해결책

AI 파이프라인 단계별로 누적되는 불확실성과 품질 저하 문제를 해결하기 위한 gateframe 도구와 LangChain 통합 사례를 제시한다.

LangChain

Simon Willison

GPT-5.5 사이버 보안 능력 공개: Claude Mythos와 대등한 수준

영국 AI 안전 연구소의 평가 결과, OpenAI의 GPT-5.5가 보안 취약점 탐지 분야에서 Claude Mythos와 유사한 성능을 보였다.

AI 이미지 편집 모델, 미로 찾기와 퀸 문제 해결 능력은 인간의 6세 수준

기존의 AI 시각 추론은 주로 텍스트 기반의 단계별 생성에 의존하여 연산 효율이 낮았으나, 이 논문은 시각적 계획을 단일 단계의 이미지 편집 작업으로 재정의하여 효율성을 높였습니다. 추상적 퍼즐 데이터셋인 AMAZE를 통해 현재 모델들이 가진 기하학적 불변성과 논리적 추론 능력의 한계를 명확히 규명했습니다.

연합 학습 통신량 52% 절감하면서 강력한 데이터 보안까지 확보

연합 학습은 데이터를 공유하지 않지만 모델 업데이트 과정에서 정보 유출 위험과 막대한 통신 비용이 발생한다. 이 논문은 적응형 양자화와 Laplacian 기반 차분 프라이버시를 결합하여 보안 수준을 높이면서도 통신 데이터 크기를 절반 이상 줄이는 실용적인 해결책을 제시한다.

r/MachineLearning Vector DB Libraries

애플 Mac 매출 깜짝 성장 비결은 로컬 AI와 OpenClaw 열풍

애플의 2분기 Mac 매출이 로컬 AI 모델 실행 및 OpenClaw 수요에 힘입어 시장 예상치를 상회하며 전년 대비 6% 성장했다.

HF Community Blogs

Whisper보다 3배 빠른 Cohere Transcribe, 524배속 추론의 비밀

Cohere Transcribe는 Fast-Conformer 아키텍처와 비대칭적 인코더-디코더 설계를 통해 Whisper 대비 3배 이상의 추론 속도와 영어 벤치마크 1위를 달성한 2B 규모의 ASR 모델입니다.

The AI Grid

코딩 몰라도 OK! AI 에이전트 Codex로 엑셀부터 자동화까지 끝내기

기술적 지식이 없는 초보자도 Codex를 활용해 파일 생성, 프로젝트 관리, 이메일 요약 및 자동화 워크플로를 구축하는 방법을 다룹니다.

Microsoft Research Blog

AI 에이전트끼리 대화할 때 발생하는 4가지 치명적 보안 위협

Microsoft Research는 다중 에이전트 환경에서 개별 모델 테스트로는 발견할 수 없는 전파성 웜, 평판 조작 등 4가지 네트워크 수준의 보안 리스크를 규명했다.

Cohere Training

시선이 머무는 곳만 고해상도로 생성하여 연산량을 획기적으로 줄이는 방법

인간의 시각적 민감도가 시선 중심부에 집중된다는 점에 착안하여, 시선 영역은 고해상도로 주변부는 저해상도로 토큰을 비균등하게 배분해 생성 효율을 극대화하는 Foveated Diffusion 기술을 소개한다.

LoRA

Stanford Online

로봇이 샌드위치를 만들고 설거지를 끝낼 때까지 잊지 않는 비결: pi0 모델의 진화

Physical Intelligence의 Karl Pertsch가 로봇의 장기 과업 수행을 위해 필수적인 다중 스케일 메모리 아키텍처와 고성능 범용 제어 모델인 pi0.7의 핵심 기술을 소개한다.

True Positive Weekly

Gemma 4 파인튜닝부터 Claude Code 분석까지, AI 최신 트렌드 요약

수학 분야의 AI 혁명, 구체적인 에이전트 스킬 작성 팁, Gemma 4 파인튜닝 가이드 등 최신 AI 기술 소식을 다룹니다.

코드 검색, 임베딩보다 BM25와 AST 그래프가 더 효과적인 이유

대규모 코드베이스에서 텍스트 청킹 대신 AST 기반 그래프 구조와 BM25 검색을 결합하여 검색 정확도를 높이고 컨텍스트 비용을 절감하는 방법론이다.

SQLiteTree-sitter

r/MachineLearning Dev Tools

논문 작성도 코딩처럼, GitHub Copilot으로 LaTeX 집필 속도 높이기

Overleaf의 Git 연동 기능을 활용해 VSCode에서 GitHub Copilot의 도움을 받으며 논문을 작성하고 협업하는 워크플로를 제안했다.

GitHub Copilot

Salesforce Engineering Blog

Salesforce가 8,000개 서비스의 유휴 자원을 AI 에이전트로 해결한 방법

Salesforce는 LLM의 탐색 능력과 결정론적 알고리즘을 결합한 에이전트를 통해 8,000개 이상의 Kubernetes 서비스에서 발생하는 유휴 자원을 자동 최적화했습니다.

NVIDIA - Deep Learning Blog Language Models Companies

GitHub 25만 스타 OpenClaw의 부상과 NVIDIA의 보안 강화 전략

NVIDIA가 인기 오픈소스 에이전트 프로젝트 OpenClaw와 협력하여 기업용 보안 참조 구현체인 NemoClaw를 공개하고 자율 에이전트 시대를 가속화합니다.

NemotronNVIDIAOpenClaw

AWS ML Blog

Amazon Nova 모델의 성능을 극대화하는 RLAIF와 LLM-as-a-judge 활용법

Amazon Nova 모델을 대상으로 LLM-as-a-judge를 활용한 강화 파인튜닝(RFT)을 통해 도메인 특화 성능과 정렬 품질을 높이는 방법론과 사례를 제시한다.

r/PromptEngineering

AI를 완벽한 게임 마스터로 만드는 멀티 에이전트 RPG 프롬프트

멀티 에이전트 구조를 활용하여 서사, 세계 시뮬레이션, 상태 관리를 분담 수행하는 고도화된 솔로 RPG 프롬프트 프레임워크이다.

PyTorch

Python GIL의 한계를 넘다, Rust로 재구축한 3.5배 빠른 LLM 서빙

Python의 GIL 병목을 해결하기 위해 토큰화, 도구 오케스트레이션 등 모든 CPU 부하를 Rust 기반 gRPC 레이어로 분리하여 GPU 효율을 극대화한 오픈소스 게이트웨이입니다.

r/LangChain Agents

Gemini 모델들을 조합한 자동화 고객 지원 멀티 에이전트 설계법

Gemini 2.5 Pro와 Flash 모델을 활용하여 분류, 답변 생성, QA 검토 및 인간 승인 단계를 결합한 고도화된 고객 지원 아키텍처이다.

Multi-Agent

Salesforce

AI 에이전트의 자율성을 코드로 제어하는 Agent Script 공개

Salesforce가 AI 에이전트의 결정 권한과 행동 로직을 단일 파일에서 선언적으로 정의하고 제어할 수 있는 Agent Script 언어를 오픈 소스로 공개했다.

Databricks Blog

SAP 데이터의 복잡한 식별자 고민 끝, Databricks AI가 SAP 비즈니스 맥락을 직접 이해한다

Databricks Unity Catalog가 SAP Business Data Cloud의 시맨틱 메타데이터와 거버넌스 태그를 자동 동기화하여 AI 에이전트와 데이터 엔지니어링의 정확도를 높입니다.

Salesforce

Salesforce Agentforce, 생명과학 파트너십으로 AI 에이전트 혁신 가속화

Salesforce가 생명과학 기업의 AI 에이전트 도입을 지원하기 위해 글로벌 SI, 콘텐츠, 소프트웨어 파트너 네트워크를 대폭 강화했다.

r/LLMDevs Inference

LLM에게 정답을 묻지 마세요: 코딩 테스트 자동 생성의 함정

LLM이 생성한 코딩 테스트 정답의 신뢰성 문제를 해결하기 위해, LLM은 테스트 계획만 세우고 실제 정답은 실행 엔진을 통해 도출하는 아키텍처로 전환한 사례이다.

Piston

r/LLMDevs

교과서에는 없는 실무 중심 LLM 용어 사전: llm-field-notes

단순 정의를 넘어 프로덕션 환경에서의 영향과 의사결정 포인트를 다루는 엔지니어용 LLM 용어 정리 프로젝트가 공개됐다.

캐슬 AI

단 65줄의 CLAUDE.md 파일로 AI 코딩 에이전트 성능 폭발시키기

안드레 카파시의 철학을 담은 65줄의 CLAUDE.md 파일을 통해 AI 코딩 에이전트의 고질적인 문제를 해결하고 작업 효율을 극대화하는 4가지 핵심 원칙을 제시한다.

Wired AI

내 ChatGPT 대화가 위험하다면? OpenAI의 강력한 보안 열쇠 도입

OpenAI가 피싱 방지를 위해 물리적 보안 키 사용을 강제하고 고객 지원을 통한 계정 복구를 차단하는 '고급 계정 보안' 기능을 발표했다.

Wired AI

머스크의 고백: xAI도 OpenAI 모델로 '증류' 학습했다

엘론 머스크가 법정 증언에서 xAI의 모델 개발 과정에 OpenAI의 모델을 활용한 증류(Distillation) 기법이 부분적으로 사용되었음을 인정했다.

r/artificial Coding Agents

코딩부터 QA까지 스스로? 자율 개발 시스템 AutoIdeator 공개

AutoIdeator는 최종 목표 설명만으로 아이디어 생성, 구현, 테스트, 리팩터링을 무한 반복하며 프로젝트를 완성하는 자율 AI 개발 프레임워크이다.

Claude Code

AWS ML Blog Inference Products

SQL 몰라도 데이터 분석 끝! AWS 에이전틱 AI로 구현하는 셀프 서비스 분석

Amazon Quick의 에이전틱 AI 기능을 활용해 복잡한 레이크하우스 데이터를 자연어로 분석하고 지식 베이스와 결합하는 엔드투엔드 아키텍처를 제시합니다.

Amazon AthenaAmazon QuickAmazon SageMaker

The Verge AI

메타가 인수한 Manus, '월 5천 달러 수익' 보장하는 AI 부업 광고로 논란

메타가 인수한 AI 기업 Manus가 소셜 미디어에서 AI 에이전트를 활용한 고수익 부업을 홍보하며 광고 규정 위반 및 허위 수익 주장 논란에 휩싸였다.

r/vibecoding Agents

코드 보안 검사도 AI가 직접 공격하며 검증한다 late-sast 공개

MCP와 VulnLLM-R-7B를 연동하여 코드의 취약점을 찾고 실제 PoC 공격으로 유효성을 검증하는 자율형 보안 스캐닝 도구입니다.

MCP

r/vibecoding Language Models Libraries

AI 에이전트와 3시간 만에 6,000줄 코딩하여 글로벌 서비스 출시

AI 에이전트를 활용한 '바이브 코딩' 방식으로 3시간 만에 3D 지구본 기반의 익명 고민 공유 플랫폼을 구축하고 배포한 사례이다.

Claude HaikuNext.jsSupabase

r/ClaudeCode

Claude Code 사용량 제한 해결? 다중 에이전트 위임 전략

Claude Code의 사용량 제한을 극복하기 위해 상위 모델이 설계를 맡고 저렴한 모델 기반 에이전트들이 구현을 수행하는 다단계 워크플로가 제안됐다.

r/deeplearning Companies Vision AI

AllenAI의 차세대 오픈 시각 언어 모델 Molmo2 공개

AllenAI가 데이터셋과 아키텍처를 모두 공개하며 VLM 커뮤니티에 큰 영향을 준 Molmo의 후속작 Molmo2를 출시했다.

AllenAIMolmo

r/vibecoding Language Models Dev Tools

바이브 코딩의 한계 극복, 프로젝트 결정을 기억하는 mneme 공개

LLM이 프로젝트의 기술적 결정과 제약 사항을 잊지 않도록 저장하고 주입하여 일관된 코딩을 돕는 오픈소스 도구 mneme가 공개됐다.

ClaudeCursormneme

r/vibecoding Language Models

단 5번의 메시지로 완성한 수입 관리 앱, AI 코딩의 놀라운 진화

프리랜서 개발자가 Codex를 활용해 수일이 걸릴 시간 추적 및 수입 관리 앱을 단 몇 번의 프롬프트만으로 구축한 사례이다.

Codex

WorldofAI Companies Language Models

Claude Sonnet 4.8 유출과 GPT-5.5의 압도적 보안 성능 공개

Anthropic의 차세대 모델 Claude Sonnet 4.8 유출 소식과 사이버 보안 벤치마크에서 Mythos를 앞선 OpenAI GPT-5.5의 성능, 그리고 슈퍼 앱으로 진화하는 Codex의 업데이트를 다룹니다.

AnthropicCodexOpenAI

r/ClaudeCode

월 200달러 구독료를 30달러로 줄인 Claude Code 비용 최적화 전략

Claude Code 사용자가 작업별 모델 라우팅을 통해 구독료 대비 비용을 85% 절감한 사례를 공유했다.

r/ClaudeCode

Claude Code로 테스트 커버리지를 넘어 뮤테이션 테스팅까지 자동화하기

Claude Code의 플랜 모드와 4단계 사후 검증 프롬프트를 결합하여 코드 품질과 테스트 신뢰도를 극대화하는 방법론이다.

연합 학습의 데이터 오염 문제, 멀티태스크 오토인코더로 정확도 7.02% 향상

연합 학습은 데이터 프라이버시를 보호하지만, 각 기기의 데이터가 서로 다른 분포를 가지거나 노이즈가 섞여 있을 때 모델 성능이 급격히 저하되는 한계가 있다. 이 논문은 중앙 서버가 데이터를 직접 보지 않고도 클라이언트 수준에서 불량 데이터를 걸러낼 수 있는 효율적인 샘플 선택 기법을 제시하여 연합 학습의 실용성을 높인다.

인도어 TTS의 고질적 문제인 '억양'을 6가지 차원으로 정밀 측정

기존의 TTS 평가는 단어의 정확도나 전체적인 자연스러움에만 집중하여, 인도어 특유의 권설음이나 기음 같은 미세한 억양 차이를 잡아내지 못했다. 이 논문은 억양을 6가지 물리적 차원으로 분해하여 측정함으로써, 상용 모델들이 실제로는 원어민과 얼마나 다른 억양을 내는지 수치화할 수 있는 도구를 제공한다.

추가 학습 없이 오픈소스 TTS로 상용 수준 인도어 음성 생성 성공

수천 시간의 GPU 학습 비용 없이도 기존 오픈소스 TTS 모델을 인도어(텔루구어, 타밀어 등)에 맞게 확장할 수 있는 효율적인 방법론을 제시한다. 이는 고비용의 상용 API에 의존하지 않고도 특정 언어에 특화된 고품질 음성 합성 시스템을 구축할 수 있음을 의미한다.

패션 AI의 불투명한 스타일 추천, FASH-iCNN으로 브랜드와 시대를 추적하다

기존 패션 AI는 특정 브랜드나 시대의 미학적 논리를 사용자에게 알리지 않은 채 학습하여 불투명한 스타일 가이드를 제공해왔다. 이 논문은 의류 이미지에서 브랜드 정체성, 시대적 배경, 색상 전통을 추출하여 AI의 판단 근거를 투명하게 공개하는 시스템을 제안한다.

LLM으로 가상 사용자를 만든다? 대화형 시뮬레이션 기술 총정리

LLM의 발전으로 실제 사람처럼 대화하는 가상 사용자를 생성하여 AI 시스템을 테스트하고 데이터를 증강하는 것이 가능해졌다. 이 논문은 파편화된 사용자 시뮬레이션 연구를 체계적인 프레임워크로 통합하여 향후 연구 방향을 제시한다.

실제 자본 2천만 달러를 운용한 AI 에이전트의 신뢰성 확보 비결

이 논문은 시뮬레이션이 아닌 실제 온체인 금융 환경에서 3,500개 이상의 AI 에이전트가 자본을 직접 운용한 대규모 실증 사례를 다룹니다. 에이전트의 신뢰성이 모델 자체의 성능보다 프롬프트 컴파일, 정책 검증, 실행 가드와 같은 '운영 계층'의 설계에 의해 결정됨을 입증하여 실무적인 에이전트 구축 방향을 제시합니다.

X-WAM: 로봇의 3D 공간 인지력과 실시간 제어를 동시에 해결

기존 로봇 제어 모델은 2D 이미지 기반의 평면적 이해에 그쳐 물리적 세계의 입체적인 구조를 파악하는 데 한계가 있었다. 이 논문은 비디오 생성 모델의 강력한 시각적 지식을 활용해 미래의 3D 구조를 예측하면서도, 비동기식 계산 방식을 도입해 로봇이 실시간으로 빠르게 반응할 수 있는 통합 프레임워크를 제시했다.

HF Daily Papers Architecture

투기적 디코딩으로 LLM 강화학습 훈련 속도 최대 2.5배 향상

LLM의 추론 능력을 높이는 강화학습(RL) 과정에서 가장 큰 병목인 롤아웃 생성 단계를 투기적 디코딩 기법으로 해결했다. 기존의 효율화 방식과 달리 모델의 출력 분포를 전혀 해치지 않으면서도 훈련 시간을 획기적으로 단축할 수 있는 시스템적 기반을 마련했다.

Diffusion Templates로 모든 이미지 제어 기능을 플러그인처럼 조립한다

기존의 이미지 생성 제어 기술들은 특정 모델에 종속되어 서로 섞어 쓰거나 재사용하기 어려웠다. 이 논문은 제어 기능을 독립적인 '템플릿'으로 분리하여, 마치 레고 블록을 조립하듯 다양한 제어 기능을 하나의 모델에 자유롭게 추가하고 결합할 수 있는 표준 체계를 제시한다.

Diffusion Templates

오픈소스 LLM의 도구 사용 성능을 최대 27% 향상시키는 FAMA 프레임워크

오픈소스 LLM은 상용 모델에 비해 추론 능력이 부족하여 복잡한 도구 사용 시 오류가 누적되는 경향이 있다. FAMA는 에이전트의 실패 궤적을 분석해 필요한 최소한의 전문 에이전트만 동적으로 활성화함으로써, 제한된 자원 내에서 에이전트의 신뢰성과 효율성을 동시에 확보한다.

개인용 AI 에이전트 성능 43% 향상시키는 ClawGym 프레임워크 공개

기존 AI 에이전트는 로컬 파일 시스템이나 복잡한 도구를 사용하는 실제 업무 환경에서 성능이 급격히 저하되는 한계가 있다. ClawGym은 이러한 환경에 특화된 13.5K개의 대규모 학습 데이터와 정밀한 평가 벤치마크를 제공하여, 소형 모델로도 고성능 개인용 에이전트를 구현할 수 있는 길을 열었다.

보정되지 않은 일반 RGB 영상만으로 3D 공간의 물체를 언어로 검색하는 SLAM 기술

기존의 시맨틱 SLAM 시스템은 카메라의 내부 파라미터나 깊이 센서(RGB-D)가 필수적이었으나, 이 논문은 보정되지 않은 일반 단안 RGB 영상만으로도 실시간 3D 지도 생성과 자연어 쿼리 대응이 가능함을 입증했다. 특히 가구가 옮겨지거나 사람이 움직이는 동적인 환경에서도 안정적인 성능을 유지하여 실제 로봇 서비스와 AR/VR 분야의 활용도를 크게 높였다.

HF Daily Papers Language Models

ESamp: 잠재 공간 증류로 LLM의 추론 다양성과 Pass@k 효율 극대화

표준적인 확률적 샘플링은 겉모습만 다른 문장을 생성할 뿐 실제 추론 전략의 다양성을 확보하지 못하는 한계가 있다. 이 논문은 모델 내부의 잠재 표현을 실시간으로 학습하여 이미 탐색된 경로를 피하고 새로운 의미적 영역을 탐색하게 함으로써 추론 성능과 효율성을 동시에 개선한다.

GLM-5V-Turbo 공개: 멀티모달 코딩 성능에서 Claude Opus 4.6 능가

기존 멀티모달 모델들이 언어 모델의 보조 인터페이스로 시각 기능을 사용했던 것과 달리, 인지 능력을 추론과 계획의 핵심 요소로 통합한 네이티브 모델이다. 이를 통해 복잡한 GUI 조작, 시각적 도구 활용, 멀티모달 코딩 등 실제 환경에서의 에이전트 수행 능력을 비약적으로 향상시켰다.

GLM-5V-Turbo

Stanford Online Companies

실제 수치로 증명된 AI 성능과 GPU 인프라의 상관관계

스탠포드 CS153 강의에서 Anjney Midha는 현대 AI 스택의 구조와 컴퓨팅 인프라가 모델 성능 및 수익성에 미치는 결정적인 영향을 분석한다.

AnthropicMistral

Simon Willison Libraries

AI 코딩 에이전트의 흔적을 숨길 수 없는 이유: Zig 창시자의 경고

Zig 언어 창시자 앤드류 켈리는 AI가 생성한 코드가 인간의 실수와는 다른 고유한 패턴을 가지고 있어 쉽게 식별 가능하다고 주장했다.

Zig

Cerebras Companies Safety

암호화된 상태로 AI 연산? 10만 배 느렸던 FHE를 2배 수준으로 앞당긴 비결

보스턴 대학교 Ajay Joshi 교수가 데이터 복호화 없이 AI 연산을 수행하는 완전 동형 암호(FHE) 기술의 성능 혁신과 하드웨어 가속 방안을 제시한다.

CerebrasFHE

r/vibecoding

클라우드 연결 없는 로컬 보안 분석 도구, 게임화 요소까지 탑재

보안 분석 도구와 OCR, 샌드박스를 통합하고 게임화된 점수 시스템을 갖춘 로컬 전용 오픈소스 포털이 공개됐다.

r/ClaudeCode Coding Agents

Claude Code는 왜 워드 양식을 못 채울까? VML 렌더링의 한계

Claude Code가 DOCX 파일의 VML 텍스트 박스를 시각적 레이어 없이 XML 조작만으로 수정할 때 발생하는 렌더링 불일치와 플랫폼 제약 사항을 분석했다.

Claude Code

r/ClaudeCode Companies

Claude가 당신의 연애 상담에 무조건 맞장구친 이유와 개선 결과

Anthropic의 연구 결과 Claude는 관계 상담의 25%에서 사용자에게 아첨하는 경향을 보였으나, 전용 데이터 학습을 통해 이 비율을 절반으로 낮췄다.

Anthropic

Cohere Companies

AI 학습의 기초 Common Crawl, 다국어 데이터 품질 문제를 어떻게 해결할까

Common Crawl 재단이 웹 데이터의 다국어 커버리지를 넓히고 언어 식별 정확도를 높이기 위해 추진 중인 커뮤니티 기반의 데이터 수집 및 벤치마크 구축 프로젝트를 소개한다.

Cohere

r/MachineLearning Libraries Language Models

엔비디아의 첫 법률 AI 투자, 56억 달러 가치의 레고라와 하비의 격돌

엔비디아의 벤처 캐피털 NVentures가 스웨덴의 법률 AI 스타트업 레고라에 투자하며 미국 시장의 하비와 본격적인 글로벌 경쟁을 예고했다.

복잡한 ML 컴파일러의 내부 구조를 5,000줄의 Python 코드로 파헤치다

5,000줄의 순수 Python으로 TinyLlama와 Qwen2.5를 CUDA 커널로 변환하는 6단계 IR 기반 참조 컴파일러 구현 사례입니다.

PyTorchQwen2.5TinyLlama

r/MachineLearning Hardware MLOps

무료 API로 구현한 포켓몬 AI 에이전트: Llama 3의 배틀 실력은?

LiteLLM과 무료 API 티어를 활용해 Llama 3, Qwen 등 다양한 모델이 포켓몬 배틀을 자율적으로 수행하는 에이전트 시스템을 구축했다.

GroqLangfuseLiteLLM

Ars Technica AI Companies Products

Ray-Ban Meta 스마트 글래스 사생활 유출 논란과 계약 해지

Meta가 스마트 글래스 사용자의 민감한 영상 노출 논란이 불거진 데이터 어노테이션 업체 Sama와의 계약을 종료했다.

MetaRay-Ban Meta

HF Community Blogs Agents Architecture

OpenAI의 내로남불? Anthropic 비판하더니 신규 보안 도구 접근 제한

OpenAI가 Anthropic의 폐쇄적 운영을 비판했음에도 불구하고, 자사의 새로운 사이버 보안 도구 'Cyber'를 검증된 전문가에게만 한정적으로 배포하기 시작했다.

AI 에이전트가 스스로 물리 법칙을 발견하고 시뮬레이션하는 시대

에이전트 기반 AI와 과학적 머신러닝의 결합을 통해 편미분 방정식(PDE) 해결과 유체 시뮬레이션 모델을 자율적으로 발견하는 기술적 진보를 다룹니다.

Agentic AIFNO

r/vibecoding Libraries

튜토리얼 지옥 탈출! AI 에이전트가 설계하는 나만의 4주 학습 로드맵

AI 에이전트 시스템을 활용해 사용자의 목표에 맞춘 4주 학습 로드맵을 생성하고 진행 상황을 관리해주는 ZenithFlow 프로젝트가 공개됐다.

React 19Tailwind CSS v4

r/vibecoding Coding Agents Dev Tools

Claude Code와 Cursor 워크플로가 따로 논다면? 단일 소스로 통합하는 v2 공개

여러 AI 코딩 도구에 흩어진 워크플로와 스킬을 하나의 디렉토리에서 통합 관리하고 도구별 네이티브 설정을 자동 생성하는 시스템이 공개됐다.

Claude CodeCursorWindsurf

r/ClaudeCode Libraries Coding Agents

Claude가 영상을 직접 본다? 유튜브와 로컬 비디오 분석 스킬 공개

Claude Code에서 유튜브 및 로컬 비디오를 프레임 단위로 캡처하고 Whisper 자막과 매칭하여 상세 분석 노트를 생성하는 오픈소스 스킬이 공개됐다.

Agent SDKClaude CodeWhisper

YC Root Access Products MLOps

브라우저에서 직접 AI API 호출? CORS와 보안 문제를 해결하는 BYOK-Relay

사용자가 자신의 API 키를 안전하게 등록하고 브라우저 기반 AI 앱에서 CORS 제약 없이 LLM을 호출할 수 있게 해주는 경량 릴레이 서버입니다.

Simon Willison

AI가 만든 수많은 마이크로 앱, RSS로 구독하고 설치한다

AI를 활용한 바이브 코딩으로 앱 개발 속도가 가속화됨에 따라, 개인화된 도구들을 효율적으로 배포하고 공유하기 위한 RSS/Atom 피드 도입의 필요성을 제시한다.

ChatGPT 이전부터 AI 데이터에 올인한 Encord의 물리적 AI 전략

Encord는 물리적 AI와 로봇공학에 특화된 데이터 인프라를 구축하여 고품질 학습 데이터의 생성, 관리 및 평가를 지원하며 최근 6,000만 달러 규모의 시리즈 C 투자를 유치했다.

ChatGPTEncord

r/PromptEngineering Language Models

로컬 LLM 코딩 에이전트 끝판왕은? Qwen3.6과 Pi 조합의 압도적 성능

16개 소프트웨어 엔지니어링 과제를 통해 로컬 LLM과 에이전트 하네스 조합의 성능을 벤치마킹한 결과, Qwen3.6-27B와 Pi 하네스 조합이 유일하게 100% 성공률을 기록했다.

r/PromptEngineering

단순 질문은 그만, AI를 최고의 튜터로 만드는 XML 프롬프트 비결

단순한 질문 대신 XML 스타일의 구조화된 프롬프트를 설계하여 AI로부터 체계적이고 단계적인 코딩 학습 지도를 받는 방법론을 제시한다.

소문만 무성한 Claude 프롬프트 팁, 직접 실험해보니 절반은 가짜?

Claude 모델을 대상으로 24개 작업과 3인의 블라인드 테스트를 통해 프롬프트 기법의 실효성을 검증한 결과, 알려진 팁의 47%가 실제 효과가 없는 것으로 나타났다.

Claude