2026년 6월 19일 AI 뉴스 아카이브

Vizuara

LLM 추론 엔지니어링의 모든 것: 45시간 실전 워크숍 커리큘럼 공개

LLM 추론 시스템의 런타임, 도구, 인프라 계층을 아우르는 45시간 분량의 실전 엔지니어링 워크숍 내용을 요약한다.

Cohere

실세계 로봇 배포를 위한 오픈소스 VLA 모델, MolmoAct2 공개

MolmoAct2는 실세계 로봇 배포를 위해 설계된 완전 오픈소스 Vision-Language-Action 파운데이션 모델로, 적응형 추론과 개방형 데이터셋을 활용한다.

임커밋

1비트로 양자화 오차를 줄인다? TurboQuant와 QJL 분석

TurboQuant는 QJL 알고리즘을 활용해 LLM KV 캐시 양자화 시 발생하는 오차를 보정하여 성능 저하를 최소화하는 기법이다.

Analytics Vidhya

ML 시스템 설계 면접에서 알아두면 좋은 10가지 문제 흐름

ML 시스템 설계 면접의 10가지 대표 문제를 데이터 흐름, 모델 선택, 평가 지표, 운영 고려사항으로 단계별로 해석한다.

AWS ML Blog

Amazon Quick과 MCP로 Adobe 마케팅 인사이트를 실시간으로 얻는 방법

MCP를 통한 Adobe Marketing Agent의 Amazon Quick 통합으로 거버넌스 하에 마케팅 인사이트를 채팅형 대화에서 실시간으로 도출하는 구현 가이드이다.

AWS ML Blog Architecture Companies

Bedrock AgentCore 웹 검색으로 에이전트의 최신 정보가 AWS에서 바로 확보된다

에이전트가 최신 정보를 얻도록 Web Search Tool을 통해 AWS 내에서 웹 검색을 연결하고, 지식 그래프와 의미 스니펫 추출로 정확도와 신뢰성을 높인다.

AgentCoreAmazon BedrockWeb Search Tool

Two Minute Papers

AI 에이전트 간 '뇌'를 연결해 성능은 높이고 비용은 75% 줄이는 법

RecursiveMAS는 에이전트 간 잠재 상태를 직접 전송하는 재귀적 협업 구조로, 토큰 사용량을 75% 절감하고 수학 문제 해결 정확도를 크게 높였다.

KDNugget

노브 시리즈: 손실 함수로 모델이 틀렸을 때 어떻게 배우는가

손실 함수의 아이디어와 대표 함수(MSE/MAE/Cross-Entropy)의 차이, 그리고 학습 루프에서의 피드백 메커니즘을 초보자도 이해하도록 설명한다.

AI Andy

Claude Opus 4.8 vs GLM 5.2: 6가지 코딩 과제로 본 성능과 비용의 진실

Claude Opus 4.8과 GLM 5.2를 6가지 복잡한 코딩 과제로 비교하여 성능과 비용 효율성을 분석한다.

Stackoverflow

ROA 패턴으로 고위험 AI 시스템의 실행 거버넌스 강화

고위험 에이전트 시스템의 실행 거버넌스를 강화하기 위해 책임 계약, 임무 고정, 의심의 분리, 기억의 유지, 의사결정 추적, 그리고 HOTL로의 전환을 제시한다.

Hacker News - LLM Products Companies

모든 LLM 공급자를 하나의 API로 관리하는 솔루션

Wyolet Relay는 하나의 API 엔드포인트로 OpenAI·Anthropic 등 다수 공급자를 연결하고, 키 관리와 비용 추적을 자체 인프라에서 가능하게 한다.

RelayWyolet

Interconnects (Nathan Lambert)

오픈 소스 AI를 규제하면 왜 교육과 혁신이 손실될까

오픈 소스는 교육, 혁신, 경쟁의 토대이며 이를 규제하는 것은 AI 생태계의 성장과 안전성까지 저해할 수 있다.

Kili Technology Blog

대규모 데이터 라벨링 운영의 플랫폼 선택 포인트를 공개

대규모 멀티프로젝트 데이터 라벨링 운영에서 플랫폼 간 차이와 Kili의 경쟁력을 비교 분석한다.

TechCrunch AI Companies

AI 인프라 시장의 새 바람, Allbirds의 Smartbird 여정

Allbirds가 AI 인프라로 전환하며 Smartbird를 통해 데이터 주권과 단일-테넌트 운영으로 AI compute를 공급하려 한다.

Allbirds

All About AI

Polymarket에서 수수료와 슬리피지를 피하는 에이전트 AI 트레이딩 전략

방대한 시장 데이터를 분석해 적정 가격을 산출하고, 수수료와 슬리피지를 최소화하는 에이전트 AI 트레이딩 전략을 구현한다.

Future of Life Institute Companies

AI 인격권, 필요할까? 법적 책임의 미래를 묻다

AI 인격권에 대한 역사적 맥락과 현대적 위험, 책임 분배의 함의를 분석하여 현 정책 방향의 필요성과 한계를 제시한다.

Dutch East India Company

IBM Technology Image Gen Language Models

인터넷 트래픽의 57%가 AI 봇? Microsoft의 신규 MoE 모델과 AI 영화의 미래

AI 봇의 웹 트래픽 점유율, Microsoft의 신규 모델 MAI 시리즈, 그리고 Tribeca 영화제에 등장한 AI 영화의 미래를 다룬다.

MAI-Image-1MAI-Thinking-1Microsoft

Hacker News - LLM

MQ-2 가스센서로 LLM 샘플러를 실시간으로 바꿔보는 오프라인 수트케이스 로봇의 실험

MQ-2 가스센서를 Sparky 케이스에 탑재하고 매 0.5초마다 baseline과 비교하여 샘플러를 토큰별로 재배치하는 피드백 루프를 구축했다. 온도, top_p, top_k 등의 설정 변화에 따라 토큰 분포가 확산되며 대화에 독창성과 변화를 부여한다.

Dataiku Blog

엔터프라이즈용 에이전트 AI 플랫폼 고를 때 반드시 점검할 점

기업용 에이전트 AI 플랫폼은 거버넌스, 통합성, 성능 벤치마크를 종합적으로 평가해야 한다.

Latent Space (swyx)Language Models

GLM-5.2 오픈 가중치로 프런티어 모델 시대를 열다

GLM-5.2의 오픈 가중치와 IndexShare가 추론 비용을 크게 낮추며 오픈 모델 생태계의 상용 가능성을 높인다.

GLM-5.2

The Verge AI

5개월 만에 떠난 Barret Zoph, OpenAI의 엔터프라이즈 전략은 어디로 가나

오픈AI의 엔터프라이즈 세일즈 책임자 Barret Zoph가 재직 5개월 만에 회사를 떠나며 엔터프라이즈 중심 전략의 지속 가능성에 의문을 남겼다.

Artificial Intelligence

AI 에이전트와 소프트웨어를 연결하는 'MCP', 왜 필수인가?

AI 에이전트가 외부 데이터와 도구에 원활하게 접근하도록 돕는 표준 프로토콜인 MCP의 개념과 실무 활용법을 알아본다.

The AI Daily Brief

G7 정상회의에서 논의된 AI 규제와 Mythos, Fable 모델의 미래는?

G7 정상회의에서 글로벌 리더들이 AI 위험 관리와 국제 협력을 논의하며 Mythos와 Fable 모델의 접근성을 다뤘다.

Cohere

딥러닝의 핵심 수학: 역전파와 자동 미분의 원리 완벽 정리

신경망 학습의 근간인 손실 함수, 역전파, 자동 미분의 수학적 원리와 구현 방식을 1저자 관점에서 심층 분석한다.

Roboflow Blog

Roboflow 워크플로 변경 사항이 즉시 적용되지 않는 이유와 해결법

Roboflow Inference 서버의 워크플로 캐싱 메커니즘을 이해하고, 캐시 만료나 수동 갱신을 통해 최신 워크플로를 즉시 적용하는 방법을 다룹니다.

TechCrunch AI

Snap, 비용 절감 위해 생성형 AI 비디오 팀 'Dotmo' 분사

Snap이 내부 생성형 AI 비디오 팀을 'Dotmo'라는 별도 법인으로 분사하여 운영 비용을 절감하고 기술 라이선스를 제공한다.

r/ClaudeAI

Claude Code가 완벽하게 작성한 코드, 왜 프로덕션에서는 에러가 날까?

AI 코딩 에이전트가 코드 생성에는 능숙하지만 실제 동작 검증에는 취약하다는 점을 지적하며, 런타임 검증을 위한 새로운 도구의 필요성을 논의함.

r/ClaudeAI

AI 코딩 에이전트의 코드 비대화 문제, 두 가지 철학을 결합해 해결하다

gstack의 계획 능력과 ponytail의 코드 최소화 철학을 결합하여 코드 생성량을 60-80% 줄이고 정확도를 높인 ponystack 개발 사례.

r/deeplearning

VLM은 왜 체스판 좌표를 틀릴까? 공간 인식 능력 평가와 실험 결과 공유

VLM의 공간 좌표 인식 능력을 체스 FEN 문자열로 평가한 결과, 모델 자체보다 샘플링 및 프롬프트 등 환경 설정이 성능에 더 큰 영향을 미침이 확인됨.

r/deeplearning

VAD-STT-LLM-TTS 파이프라인의 한계를 넘는 Moshi의 전이중 아키텍처 분석

Kyutai의 Moshi 모델이 기존 음성 AI 파이프라인의 지연 문제를 어떻게 전이중 아키텍처로 해결했는지 분석한 글입니다.

Wired AI

Meta 내부의 AI 조직 갈등부터 Anthropic의 모델 수출 규제 협상까지

Meta의 AI 조직 개편에 따른 내부 불만, SpaceX의 Cursor 인수, Anthropic의 모델 수출 규제 협상 등 주요 테크 이슈를 다룬다.

Roboflow Blog

산업 현장 맞춤형 AI 모델, 기성 모델과 무엇이 다른가?

산업용 컴퓨터 비전 프로젝트에서 기성 모델은 프로토타이핑에 적합하며, 특정 도메인 객체 탐지를 위해서는 RF-DETR과 같은 모델의 파인튜닝이 필수적이다.

The AI Grid Architecture Language Models

1200만 토큰 컨텍스트, 기존 대비 52배 빠른 서브 쿼드라틱 LLM 등장

SubQ는 서브 쿼드라틱 스파스 어텐션 아키텍처를 통해 1200만 토큰의 컨텍스트를 효율적으로 처리하는 LLM이다.

MambaSubQ

Hugging Face Blog

딥 리서치 에이전트가 검색 중 정보를 유출하는 이유와 해결책 PA-DR

딥 리서치 에이전트가 웹 검색 과정에서 파편화된 정보를 조합해 기업 비밀을 유출하는 모자이크 효과를 분석하고, 이를 방지하는 강화학습 기반 PA-DR 기법을 제안함.

Matthew Berman

AI 코딩 에이전트 생산성 200% 높이는 실전 워크플로와 자동화 전략

AI 코딩 에이전트를 활용한 개발 워크플로 자동화, 스킬 정의, 루프 패턴 및 모범 사례를 다룬다.

Latent Space (swyx)

GPU 부족보다 심각한 문제, AI 인프라의 낮은 활용률과 해결책

AI 인프라의 낮은 활용률 문제를 지적하며, 컴퓨팅 자원을 전력망처럼 통합 관리하는 AMP의 비전과 효율적인 AI 시스템 구축 철학을 논한다.

Alignment Forum

구글 딥마인드가 제시하는 AI 에이전트 통제 로드맵: 잠재적 위협과 방어 전략

구글 딥마인드가 AI 에이전트의 적대적 행동을 탐지하고 통제하기 위한 체계적인 방어 프레임워크인 AI Control Roadmap v0.1을 공개했다.

WRITER

반복적인 팟캐스트 제작 업무, AI 에이전트로 자동화하고 창의성에 집중하세요

Writer의 AI 에이전트를 활용해 팟캐스트 사전 준비와 사후 홍보 콘텐츠 생성을 자동화하고 브랜드 보이스를 일관되게 유지하는 방법입니다.

AI Andy Language Models

Claude와 OpenAI를 위협하는 중국산 오픈소스 LLM, GLM 5.2 실전 테스트

GLM 5.2의 코딩 및 에이전트 성능을 Claude와 비교 분석하고, 실제 자동화 워크플로에 적용한 결과를 공유한다.

GLM-5.2

PyTorch Hardware Libraries

LLM으로 GPU 커널 튜닝 시간을 6.7배 단축하는 새로운 접근법

Helion 커널 튜닝에 LLM을 도입하여 기존 LFBO 대비 10배 적은 설정으로 동등한 성능을 달성하고 튜닝 시간을 6.7배 단축했다.

B200HelionPyTorch

Hacker News - LLM

무음 프롬프트로 LLM 발화 제어의 가능성을 실험하다

무음 프롬프트를 이용한 A/B 테스트에서 4개 LLM의 발화 여부가 Embodiment 프롬프트의 유무에 따라 결정되는 결과를 확인했다.

TechCrunch AI Companies

Elastic, AI SRE 스타트업 DeductiveAI 인수하며 관측성 플랫폼 강화

Elastic이 AI 기반 소프트웨어 버그 탐지 스타트업 DeductiveAI를 최대 8,500만 달러에 인수하며 자사 관측성 플랫폼의 자동화 기능을 강화한다.

DeductiveAIElastic

AWS ML Blog MLOps Products

LLM 추론 병목을 5분 안에 해결하는 SageMaker 상세 관측성 가이드

Amazon SageMaker가 100개 이상의 상세 추론 메트릭을 제공하며, CloudWatch Insights 대시보드와 PromQL 연동을 통해 LLM 엔드포인트의 성능과 비용을 실시간으로 모니터링하고 최적화할 수 있게 지원합니다.

Amazon CloudWatchAmazon SageMaker

Hacker News - LLM

LLM이 생성한 '유령 저자'가 학술 데이터베이스를 오염시키고 있다

LLM이 모델별로 고유한 '유령 이름' 조합을 생성하며, 이것이 학술 리포지토리와 웹 콘텐츠에 대규모로 유입되어 데이터 오염을 일으키는 현상을 분석함.

Hacker News - LLM

12M 토큰 컨텍스트와 OpenAI 호환성을 갖춘 새로운 API 공개

12M 토큰 컨텍스트 윈도우와 OpenAI 호환 엔드포인트를 제공하여 전체 저장소 처리가 가능한 풀 컨텍스트 API가 공개됐다.

TechCrunch AI Companies

AI 추론 스타트업 Baseten, 기업 가치 130억 달러로 15억 달러 투자 유치 추진

AI 추론 스타트업 Baseten이 5개월 만에 기업 가치를 130억 달러로 평가받으며 15억 달러 규모의 투자 유치를 진행 중이다.

Baseten

TechCrunch AI Companies

OpenAI, 구글 딥마인드 핵심 인재 Noam Shazeer와 전 백악관 정책관 영입

OpenAI가 구글 딥마인드 출신 Noam Shazeer와 전 백악관 정책관 Dean Ball을 영입하며 기술 및 정책 대응력을 강화한다.

Google DeepMindOpenAI

r/ClaudeAI

Claude Code의 할루시네이션을 막는 아키텍처: 검증 단계 분리하기

Claude Code로 연구 작업 시 발생하는 할루시네이션을 방지하기 위해, 생성과 검증 단계를 독립적인 도구로 분리하는 아키텍처를 제안함.

r/ClaudeAI

Claude를 챗봇으로만 쓰시나요? 숙련자가 활용하는 6단계 프레임워크

Claude를 단순 챗봇이 아닌 인프라로 활용하여 워크플로우를 자동화하고 에이전트 팀을 구축하는 6단계 활용 프레임워크를 소개한다.

r/ClaudeAI

Claude 세션 기반 대화형 아티팩트, 팀 공유 및 실시간 업데이트 지원

Claude 세션에서 생성된 대화형 아티팩트를 팀과 비공개 링크로 공유하고 실시간으로 업데이트하는 기능이 베타 출시되었다.

r/ClaudeAI

실시간 영상 팩트체크: Claude와 Serper로 구현한 InTruth

실시간 영상 대화 내용을 전사하고 Serper 검색과 Claude의 추론을 결합하여 팩트체크를 수행하는 Chrome 확장 프로그램 InTruth를 소개한다.

r/ClaudeAI

AI의 뻔한 말투가 지겹다면? 특정 작가의 문체를 완벽하게 학습시키는 프롬프트 기법

AI가 생성하는 획일적이고 지루한 문체(AI slop)를 해결하기 위해, 특정 작가의 글을 분석하여 문체적 특징과 규칙을 추출하고 이를 프롬프트에 적용하는 방법론을 공유함.

r/ClaudeAI

Claude 데스크톱 앱이 멈췄을 때 한 번에 종료하는 PowerShell 스크립트

Claude 데스크톱 앱의 관련 프로세스와 서비스를 한 번에 강제 종료하여 앱 오류를 해결하는 PowerShell 함수를 공유한다.

r/ClaudeAI

Claude Code가 자꾸 구식 코드를 짠다면? Roblox 개발용 스킬 세트 공개

Claude Code가 Roblox Luau 개발 시 구식 API를 제안하는 문제를 해결하기 위해, 최신 API 참조와 예시를 포함한 15개의 스킬 세트를 제작하여 공유함.

r/deeplearning

ResNet-18과 Focal Loss로 알츠하이머 MRI 다중 분류 성능을 높이는 방법

ResNet-18에 Squeeze-and-Excitation 블록과 Focal Loss를 결합하여 알츠하이머 MRI 데이터의 클래스 불균형 문제를 해결하고 분류 성능을 개선한 프로젝트.

TechCrunch AI

AWS가 자체 AI 칩 'Trainium'을 외부에 판매한다면? Nvidia의 독주에 제동 걸까

AWS가 자체 개발한 AI 가속기 Trainium을 외부 기업에 판매하는 방안을 검토하며 Nvidia가 주도하는 데이터센터 칩 시장에 도전장을 내밀고 있다.

TechCrunch AI

데이트 앱 사용자가 원하는 AI의 역할은 어디까지일까?

Match Group의 설문 결과, 데이트 앱 사용자는 프로필 작성 등 보조적 AI 기능은 긍정적이나 AI와의 연애에는 부정적인 것으로 나타났다.

Hacker News - LLM

프롬프트 인젝션부터 멀티모달 공격까지, LLM 보안 취약점 탐지 도구 AICU

AICU는 LLM 애플리케이션의 프롬프트 인젝션, 데이터 유출, 안전성 우회 취약점을 탐지하는 블랙박스 보안 스캐닝 도구이다.

TechCrunch AI

Karamo Brown이 선보이는 AI 웰니스 앱 'Kē', 디지털 클론으로 개인화된 조언 제공

Karamo Brown이 Delphi의 AI 기술을 활용해 개인화된 피트니스, 영양, 정신 건강 관리를 지원하는 웰니스 앱 'Kē'를 출시했다.

TechCrunch AI

AI 데이터 센터 전력난 해소 위해 FERC가 꺼낸 전력망 연계 가속화 카드

FERC가 데이터 센터의 전력망 연계 요청을 신속히 처리하도록 명령하며 급증하는 AI 전력 수요 대응에 나섰다.

Hacker News - LLM

동일 모델도 제공자마다 비용 4배 차이, Auriko의 캐시 인식 라우팅으로 해결

Auriko는 캐시 인식 라우팅을 통해 LLM 추론 비용을 최대 38.3% 절감하며, 다양한 모델과 워크로드에서 일관된 비용 효율성을 입증했다.

Hacker News - LLM

FOSS 생태계의 LLM 활용, SFC가 제시하는 전략적 가이드라인

SFC는 FOSS 프로젝트에서 LLM 기반 생성형 AI를 활용할 때 준수해야 할 공식 권고안을 발표하며, 무조건적인 금지 대신 소프트웨어 자유를 보호하는 전략적 접근을 제시했다.

Techpresso Companies

Apple의 칩 가격 인상 예고와 Google 핵심 인재의 OpenAI 이직

AI 수요 급증으로 인한 칩 가격 상승과 주요 AI 기업들의 인재 확보 경쟁 및 글로벌 표준 수립 움직임이 가속화되고 있다.

Midjourney

Hacker News - LLM

Claude Code는 왜 접근성 수정을 선택 사항으로 취급할까?

Claude Code가 프로젝트 요구사항에 명시된 접근성 준수 지침을 무시하고 속도를 우선시하는 우선순위 오류를 보이고 있다.

Eye on AI Companies

왜 기업의 88%는 AI 도입에 실패할까? '얼어붙은 중간 관리층'의 비밀

Genpact의 설문조사를 바탕으로 기업이 AI 도입에서 가치를 창출하지 못하는 근본 원인과 이를 극복하기 위한 조직적 전략을 논의한다.

Genpact

Google Cloud AI Blog Companies

구글 클라우드와 레픽 아나돌이 구현한 세계 최초 AI 예술 박물관 Dataland 개관

구글 클라우드 기술을 활용해 환경 데이터를 실시간 예술로 변환하는 세계 최초 AI 예술 박물관 Dataland가 로스앤젤레스에 개관한다.

Google Cloud

TechCrunch AI

AI 에이전트가 공간을 이해하게 만드는 법: General Intuition 20억 달러 가치 평가

General Intuition이 20억 달러 가치 평가로 3억 달러 규모의 투자 유치를 추진하며, 게임 영상 데이터를 활용해 AI 에이전트의 공간-시간 추론 능력을 학습시키는 월드 모델 개발에 나선다.