2026년 4월 9일 AI 뉴스 아카이브

r/LangChain Libraries

LangGraph 에이전트가 이전 대화를 잊어버린다면? 한 줄로 해결하기

LangGraph에서 ReAct 에이전트가 대화 맥락을 유지하지 못하는 문제는 상태 정의 시 add_messages 리듀서를 추가하여 해결할 수 있다.

LangGraph

r/LangChain

헬스케어 AI 에이전트, 모든 데이터를 프롬프트에 넣으면 안 되는 이유

헬스케어와 같은 규제 산업에서 AI 에이전트의 안전성과 정확성을 보장하기 위해 워크플로 단계별로 컨텍스트를 제어하는 계층 설계의 필요성을 논의한다.

r/LLMDevs

터미널에서 데이터시트를 직접 질문한다? 로컬 LLM 기반 NeuroTerm 공개

임베디드 리눅스 개발을 위해 로컬 LLM과 RAG를 통합하여 자연어 명령어 변환 및 데이터시트 질의를 지원하는 터미널 도구 NeuroTerm이 공개되었다.

r/LLMDevs

Claude Code의 프론트엔드 구현 정확도를 높이는 DESIGN.md 생성 도구

웹사이트의 디자인 시스템을 분석하여 Claude Code의 프론트엔드 컨텍스트로 활용 가능한 DESIGN.md 명세서를 생성하는 도구 DesignMD를 소개한다.

r/ClaudeAI Coding Agents Agents

코딩 에이전트의 승부처는 모델 성능이 아닌 '설정 레이어'다

Claude Code의 설정 플러그인이 반복적인 프로젝트 환경 구축을 자동화하여 코딩 에이전트의 실질적인 생산성을 결정짓는 핵심 요소로 작용한다.

Claude CodeMCPVerdent

r/ClaudeAI

Claude로 영상 분석하기: 프레임 추출과 자막 매핑으로 구현하는 멀티모달 워크플로

yt-dlp, ffmpeg, Deepgram API를 조합하여 Claude가 영상을 이해할 수 있도록 프레임과 자막을 매핑하는 자동화 파이프라인을 구축했다.

r/artificial

Uber는 왜 4개월 만에 AI 예산을 다 썼을까? AI 코딩 도구의 비용 위기

AI 코딩 도구의 에이전트 워크플로가 토큰 소비를 폭발시켜 기업들이 고정 가격제에서 사용량 기반 과금으로 전환하고 비용 효율적인 모델 라우팅을 도입하고 있다.

r/artificial

AI가 자신 있게 거짓말을 할 때: 능력보다 신뢰성이 중요한 이유

AI 모델은 언어 패턴 예측에 뛰어나지만 사실 검증이 필요한 영역에서는 오류가 발생하므로, 고위험 작업에는 인간의 검증이 필수적이다.

r/MLOps

메타의 경고에도 168개 모델이 탈정렬된 이유: '정렬 세금'이 프로덕션 성능을 갉아먹는 방식

메타의 법적 대응에도 불구하고, 자동화된 거부 벡터 제거 기술로 168개 모델이 탈정렬되었으며, 이는 정렬된 모델의 '정렬 세금'이 프로덕션 추론 효율성을 저하시킨다는 점을 시사함.

Simon Willison

AI가 내 대화를 듣고 광고를? '능동적 청취' 마케팅의 실체와 FTC의 제재

FTC가 'AI 기반 능동적 청취'를 내세워 광고 타겟팅을 수행한다고 속인 기업들에 대해 제재를 가했습니다.

Artificial Intelligence Companies

Anthropic의 흑자 전환과 SpaceX의 거대 데이터 센터 투자: AI 업계의 거대한 변화

SpaceX의 데이터 센터 투자, Anthropic의 수익성 개선, Google의 AI 에이전트 생태계 등 AI 업계의 주요 소식을 다룹니다.

AnthropicGoogleSpaceX

KT Cloud

AI 데이터센터가 기존 서버실과 다른 이유: 전력 변동과 액체 냉각의 시대

AI 데이터센터는 GPU의 동기화된 부하 패턴과 고밀도 발열 문제를 해결하기 위해 전력 품질 관리와 액체 냉각 기술을 도입해야 한다.

Hacker News - LLM Dev Tools

11개 AI 제공업체의 무료 토큰을 하나로, FreeLLMAPI 활용법

11개 AI 제공업체의 무료 LLM API 할당량을 통합하여 OpenAI 호환 프록시로 제공하는 오픈소스 도구.

FreeLLMAPI

100

The AI Daily Brief

Anthropic IPO 임박과 AI 업계의 새로운 국면

Anthropic의 IPO 준비 소식과 AI 행정명령, 그리고 Andrej Karpathy의 Anthropic 합류가 AI 업계에 미치는 영향.

Two Minute Papers Companies

멀티모달 모델의 KV 캐시를 90% 줄이는 시각적 추론 기법

바운딩 박스 좌표를 활용한 시각적 기본 요소 기법은 멀티모달 모델의 공간 추론 정확도를 높이고 KV 캐시 사용량을 90% 절감한다.

DeepSeek

Wired AI

대중의 반발과 규제 압박, OpenAI는 어떻게 돌파구를 찾고 있는가?

OpenAI는 AI에 대한 대중의 부정적 인식과 파편화된 규제 환경을 극복하기 위해 PR 전략을 재정비하고 주 단위 법안 조율을 통한 정책 표준화를 추진한다.

AWS ML Blog

Amazon Nova Act, HIPAA 준수 환경에서 의료 데이터 처리 가능해져

Amazon Nova Act가 HIPAA 적격 서비스로 지정되어 의료 기관에서 ePHI를 처리하는 브라우저 기반 AI 에이전트 워크플로를 자동화할 수 있게 됐다.

Latent Space (swyx)

AI 에이전트가 로컬 PC를 벗어나 클라우드 컴퓨터를 필요로 하는 이유

AI 에이전트의 폭발적 성장에 따라 기존 로컬 개발 환경을 대체할 상태 유지형 클라우드 샌드박스 인프라의 중요성이 커지고 있다.

Cursor

Cursor의 코딩 에이전트 'Composer 2'는 어떻게 만들어졌을까?

Cursor 연구팀이 코딩 에이전트 Composer 2를 개발하며 적용한 모델 선정, 사전 학습, 강화학습 및 자체 평가 벤치마크 구축 과정을 상세히 설명한다.

Hacker News - LLM

LLM이 직접 쿼리를 생성하지 않게 하라: 안전한 데이터 검색을 위한 선언적 설계

LLM이 직접 쿼리를 생성하는 대신, 정의된 필드와 연산자만 사용하는 선언적 레지스트리를 통해 안전하고 제어 가능한 데이터 검색 시스템을 구축하는 방법.

DeepMind Blog

Google DeepMind, 아시아 태평양 지역 기후 문제 해결 위한 AI 액셀러레이터 출범

Google DeepMind가 아시아 태평양 지역의 기후 및 환경 문제 해결을 위해 'AI for the Planet' 액셀러레이터 프로그램을 시작한다.

True Positive Weekly

DeepSeek V4의 2% KV-cache 압축과 에이전트 런타임 기술 부채

에이전트 런타임의 기술 부채, DeepSeek V4의 KV-cache 압축, Notion의 벡터 검색 최적화 사례를 포함한 AI 뉴스레터.

Simon Willison

Datasette에 AI를 더하다: 데이터 질문부터 차트 생성까지 가능한 Datasette Agent

Datasette Agent는 데이터베이스를 대화형으로 탐색하고 플러그인을 통해 차트 생성, 이미지 생성, 코드 실행 기능을 확장할 수 있는 새로운 AI 어시스턴트입니다.

Kili Technology Blog

일반 벤치마크는 끝났다: 도메인 특화 AI 평가가 실무에 필수적인 이유

일반 벤치마크의 포화로 도메인 특화 평가가 중요해졌으나, 벤치마크는 필터일 뿐 실제 프로덕션 환경에서는 전문가의 검증이 필수적이다.

AI Engineer Language Models Companies

로컬부터 클라우드까지, 에이전트 워크플로우 선택 전략

VS Code 환경에서 로컬, 백그라운드, 클라우드 에이전트를 작업 성격에 맞춰 적재적소에 활용하는 워크플로우 전략을 다룬다.

Claude OpusMicrosoft

WRITER

마케팅 문구 속 'AI스러운' 표현을 제거하고 실무에 즉시 활용하는 방법

AI 에이전트와 맞춤형 스킬을 활용해 마케팅 문구의 품질을 높이고 반복적인 콘텐츠 생성 업무를 자동화하는 전략을 제시한다.

TechCrunch AI

트럼프 대통령, AI 모델 사전 평가 행정명령 연기: "미국의 AI 리더십 저해 우려"

트럼프 대통령이 AI 모델 출시 전 정부 평가를 의무화하는 행정명령 서명을 연기하며, 규제가 미국의 AI 기술 주도권을 저해할 수 있다는 우려를 표명했다.

The Verge AI

AI로 기타 이펙트를 생성하는 299달러 페달, Polyend Endless의 가능성과 한계

텍스트 프롬프트로 기타 이펙트를 생성하는 AI 기반 페달 Polyend Endless의 기능과 실사용 경험을 분석한다.

Snyk Blog

Snyk과 Anthropic의 통합으로 Claude Enterprise 보안 거버넌스와 실시간 코드 스캔이 가능해짐

Snyk이 Anthropic의 Claude Enterprise와 통합하여 AI 자산 관리와 실시간 보안 스캔 기능을 제공한다.

AWS ML Blog Products Dev Tools

자연어로 AWS CLI 명령 실행: Amazon Quick과 MCP로 구축하는 대화형 에이전트

Amazon Quick과 AWS API MCP Server를 연동하여 자연어 쿼리로 AWS CLI 명령을 안전하게 실행하는 대화형 에이전트 구축 가이드.

Amazon BedrockAWS CLIMCP

Microsoft Research Blog

소형 모델로 구현한 고성능 AI 에이전트 시스템, MagenticLite 공개

Microsoft Research가 소형 모델(SLM)을 활용해 브라우저와 로컬 파일 시스템에서 복합 작업을 수행하는 에이전트 애플리케이션 MagenticLite를 공개했다.

NVIDIA - Deep Learning Blog Domain AI Hardware

NVIDIA, COMPUTEX 2026에서 10배 성능 향상된 Vera Rubin NVL72 등 혁신 기술 대거 수상

NVIDIA가 COMPUTEX 2026에서 Vera Rubin NVL72 슈퍼컴퓨터, Jetson Thor 엣지 AI 플랫폼, Alpamayo 자율 주행 플랫폼으로 기술 혁신을 입증했다.

AlpamayoJetson ThorVera Rubin NVL72

AI Engineer Coding Agents Language Models

하루 500개의 AI PR을 처리하는 자동화 에이전트 아키텍처

OpenClaw는 Agent Client Protocol 기반의 CLI 도구 acpx를 통해 AI 생성 PR을 자동으로 검증하고 처리하는 워크플로를 구축했다.

acpxCodex

Wired AI Products Companies

Google Gemini로 만드는 나만의 AI 아바타, 직접 써보니

Google Gemini 앱에 추가된 아바타 기능을 통해 사용자는 자신의 모습을 닮은 AI 영상을 생성할 수 있다.

GeminiGoogle

TechCrunch AI

스포티파이가 ElevenLabs와 손잡고 AI 오디오북 제작 도구를 선보인다

스포티파이가 ElevenLabs 기술을 활용한 AI 오디오북 셀프 퍼블리싱 도구를 발표하고, 오디오북 플랫폼 기능을 대폭 확장한다.

The Verge AI

할리우드가 주목하는 AI 비디오: 단순 클립 생성을 넘어선 에이전트 기반 제작의 시대

AI 비디오 기업들이 단순 영상 생성에서 벗어나 영화 제작 전 과정을 지원하는 에이전트 중심의 워크플로로 전환하고 있다.

Roboflow Blog Dev Tools Companies

산업용 자동화를 위한 Roboflow와 OPC UA 서버 연동 실전 가이드

Roboflow 워크플로의 비전 추론 결과를 OPC UA 프로토콜을 통해 산업용 제어 시스템(SCADA/PLC)으로 실시간 전송하는 방법을 다룬다.

DockerRoboflow

CMU AI News

손가락이 마이크로 변신? CMU가 개발한 SoundBubble의 작동 원리

CMU 연구진이 AR 기기의 마이크 배열과 빔포밍 기술을 활용해 손가락 끝에서 발생하는 미세한 소리를 증폭하고 추적하는 SoundBubble 기술을 개발했다.

AI Snake Oil (Arvind Narayanan)

AI를 '비정상적' 기술로 규정하고 강력히 규제하는 것이 과연 효과적인가?

AI 위험 대응을 위해 강력한 정부 개입보다는 사회 전반의 회복탄력성을 높이는 정책적 접근이 필요하다.

KDNugget

7B 파라미터 미만으로도 충분한 성능, 지금 바로 쓸 수 있는 소형 언어 모델 추천

7B 파라미터 미만의 소형 언어 모델들이 벤치마크 성능과 효율성을 개선하며 로컬 환경에서의 실무 활용 가능성을 입증하고 있다.

IBM Technology

LLM 비용 90% 절감하는 CAG와 Long Context의 차이

LLM이 외부 지식을 처리하는 두 가지 방식인 Long Context와 CAG의 원리, KV Cache 활용법, 그리고 실무 적용 기준을 비교한다.

r/deeplearning

ASI로 가는 지름길은 무엇일까? 논리와 추론 능력 강화가 답이다

ASI 달성을 위해 메모리나 패턴 인식보다 논리와 추론 능력을 강화하는 것이 가장 중요하다는 전략적 관점을 제시한다.

Practical AI

오픈소스 AI의 미래, Nous Research가 말하는 재귀적 자기 개선 에이전트

Nous Research의 공동 창업자가 오픈소스 AI 모델 'Hermes'의 탄생 배경과 재귀적 자기 개선을 수행하는 'Hermes Agent'의 개발 철학을 공유한다.

AI Supremacy

Anthropic의 Claude Cowork와 MCP로 금융 데이터를 분석하는 방법

Claude Cowork와 Model Context Protocol을 활용하여 금융 데이터 분석 및 투자 의사결정을 자동화하는 실무 가이드.

Weaviate Vector DB

AI 콘텐츠 생성의 함정, 'Aura Maxxing'으로 진정성 있는 마케팅 자동화하기

베를린 해커톤에서 AI 에이전트를 활용해 실시간 트렌드를 분석하고 개인화된 콘텐츠를 생성하는 'Aura Maxxing' 프로젝트 개발 과정을 담았다.

Weaviate

r/MachineLearning

AR 모델의 한계를 넘다: MDLM이 월드 모델링에서 보여준 15% 성능 향상

MDLM은 임의 순서 디노이징 학습을 통해 AR 모델의 순차적 생성 한계를 극복하고, 월드 모델링 작업에서 더 높은 전역적 일관성과 작업 성공률을 달성했다.

MIT AI News

기술 발전은 일자리를 뺏을까, 만들까? MIT 연구로 본 AI 시대의 고용 전망

MIT 연구진이 과거 기술 발전과 신규 일자리 데이터를 분석하여, 기술이 새로운 전문성을 요구하며 일자리를 재편하는 메커니즘을 규명하고 AI 시대의 고용 변화 가능성을 제시한다.

r/LangChain Libraries MLOps

LangGraph 에이전트 운영 비용을 하루 $300에서 $63로 80% 절감한 비결

LangGraph 에이전트의 복잡한 작업은 Opus 4.1에, 단순 반복 작업은 저가형 모델에 할당하는 하이브리드 라우팅으로 운영 비용을 80% 절감했다.

LangGraphLangSmithvLLM

r/ClaudeAI

디자인 에이전시 없이 고퀄리티 프로토타입을? Anthropic의 Claude Design 공개

Anthropic이 공개한 Claude Design은 아이디어를 즉시 시각적 프로토타입, 피치 덱, 웹 레이아웃으로 변환해주는 도구로, 브랜드 일관성을 유지하며 Canva, PowerPoint, HTML로 내보낼 수 있다.

r/artificial

AI 스마트 글래스가 실패한다면, 그 이유는 하드웨어가 아닌 인프라 때문일 것이다

AI 스마트 글래스는 실시간 데이터 처리를 위해 지속적인 고대역폭 업로드가 필요하지만, 현재의 네트워크 인프라는 다운로드 중심이라 병목 현상이 발생한다.

r/artificial

연구 속도를 1000배 높이는 자율 AI 시스템, 과학의 미래를 바꿀까?

인간의 개입 없이 가설 설정부터 실험까지 수행하는 자율 AI 연구 시스템이 등장하며 과학 연구 속도가 획기적으로 빨라질 전망이다.

TWIML AI Podcast Companies Architecture

데이터베이스의 구조를 이해하는 AI, 관계형 파운데이션 모델의 등장

스탠포드대 Jure Leskovec 교수가 기업의 관계형 데이터를 직접 학습하여 예측을 수행하는 관계형 파운데이션 모델의 원리와 활용 사례를 설명한다.

KumoRelational Foundation Models

TechCrunch AI Companies

구글의 강제적인 AI 검색이 싫다면? 사용자가 주목하는 대안 검색 엔진 6선

구글이 검색 엔진에 AI 오버뷰와 에이전트를 전면 도입하며 사용자 반발을 사는 가운데, 프라이버시와 사용자 제어를 강조하는 대안 검색 엔진들이 주목받고 있다.

Google

Hacker News - LLM

대시보드는 초록색인데 사용자는 불만족? LLM 성능 측정의 함정 'Goodput'

LLM 성능 테스트 시 전체 요청 처리량(Throughput)만 측정하면 실제 사용자 경험을 반영하지 못하므로, SLO를 만족하는 유효 처리량(Goodput)을 함께 측정해야 한다.

The Verge AI Companies

스포티파이, 유니버설 뮤직과 손잡고 AI 리믹스·커버 생성 기능 도입

스포티파이가 유니버설 뮤직 그룹과 라이선스 계약을 맺고, 프리미엄 구독자를 위한 AI 기반 리믹스 및 커버 곡 생성 기능을 도입한다.

SpotifyUniversal Music Group

AWS ML Blog Dev Tools Language Models

Amazon Bedrock AgentCore로 대시보드 수정 요청을 자동화하여 업무 효율 극대화하기

Amazon Bedrock AgentCore와 Strands 프레임워크를 활용해 자연어 기반의 대시보드 검색 및 수정 자동화 에이전트를 구축하는 방법.

Amazon Bedrock AgentCoreAmazon NovaStrands Agents

AWS ML Blog Dev Tools Language Models

OPLOG가 AI 에이전트로 영업 주기 35% 단축하고 수동 연구 시간을 98% 줄인 방법

OPLOG는 Amazon Bedrock AgentCore와 Strands Agents SDK를 활용해 영업 파이프라인 분석, 데이터 품질 관리, 잠재 고객 조사를 자동화하는 AI 에이전트 시스템을 구축했다.

Amazon Bedrock AgentCoreClaude Sonnet

AWS ML Blog Products Architecture

컨텍스트 윈도우 한계를 넘는 Recursive Language Model 구현 가이드

Amazon Bedrock AgentCore와 Strands Agents SDK를 사용하여 긴 문서를 처리하는 Recursive Language Model(RLM) 구현 방법을 다룬다.

Amazon BedrockRecursive Language Model

AWS ML Blog

SaaS 에이전트 아키텍처의 핵심: Silo, Pool, Bridge 패턴으로 멀티 테넌시 구현하기

Amazon Bedrock AgentCore를 사용하여 멀티 테넌트 에이전트 애플리케이션의 격리, 보안, 비용 효율성을 달성하는 아키텍처 패턴과 구성 요소를 제시한다.

Hacker News - LLM

Kubernetes 환경에 Kure Monitor를 배포하고 LLM 연동하는 방법

Helm 차트를 사용하여 Kubernetes 클러스터에 Kure Monitor를 설치하고 LLM 공급자를 연동하는 상세 가이드입니다.

TechCrunch AI Products Companies

스포티파이의 새로운 AI 에이전트, 내 일정과 이메일로 맞춤형 팟캐스트를 만든다

스포티파이가 개인 데이터와 웹 정보를 결합해 맞춤형 오디오 브리핑을 생성하는 데스크톱 앱 'Studio by Spotify Labs'를 공개했다.

NotebookLMSpotify

TechCrunch AI Companies

Google의 새로운 AI 에이전트, 왜 사용자들에게 혼란을 주는가?

Google I/O 2026에서 공개된 다양한 AI 에이전트 기능과 이를 유료 구독 모델로 제한한 전략에 대한 비판적 분석.

Google

TechCrunch AI

토니 로빈스가 공동 창업한 AI 테라피 앱 'The Path', 1,430만 달러 투자 유치

AI 테라피 앱 'The Path'가 1,430만 달러의 시드 투자를 유치하며, 기존 소비자용 챗봇과 차별화된 심리 치료 모델을 구축했다.

TechCrunch AI

7억 달러 투자 유치한 Hark, 차세대 AI 개인 비서와 전용 하드웨어 개발 나선다

Hark는 7억 달러 규모의 시리즈 A 투자를 유치하며 60억 달러의 기업 가치를 인정받았고, 이를 바탕으로 에이전트 AI 시스템과 전용 하드웨어 개발에 집중한다.

Databricks Blog Companies Products

Databricks Genie로 데이터 분석 병목 현상을 해결하는 산업별 AI 솔루션

Databricks Genie를 활용하여 다양한 산업군에서 자연어 기반의 데이터 분석과 의사결정을 자동화하는 파트너 솔루션들을 정리한다.

DatabricksDatabricks Genie

AI Engineer Coding Agents Companies

코딩 에이전트가 1.88배 빠른 CUDA 커널을 작성하는 법

코딩 에이전트를 활용해 CUDA 커널 최적화, 모델 파인튜닝, 멀티 에이전트 연구를 자동화하는 실무 워크플로를 소개한다.

Claude CodeHugging FaceLiveCodeBench

TechCrunch AI

재활용률 20%의 한계, AI 기반 선별 시스템으로 알루미늄 공급망을 강화하다

알루미늄 재활용 시장의 공급 부족 문제를 해결하기 위해 Sortera와 Amp 같은 스타트업들이 AI 기반 자동화 선별 시스템을 도입하여 재활용 효율을 개선하고 있다.

Hacker News - LLM Libraries

LLM 테스트 비용 0원, llm-mock으로 API 호출을 기록하고 재사용하기

llm-mock은 LLM API 호출을 로컬 JSON으로 기록하고 재사용하여 비용 절감과 결정론적 테스트를 가능하게 하는 파이썬 라이브러리이다.

llm-mock

AI Andy Coding Agents Dev Tools

Claude Code의 기억력 문제를 해결하는 AI 세컨드 브레인 구축법

Obsidian의 로컬 마크다운 파일과 Claude Code를 연동하여 세션 간 컨텍스트를 유지하는 AI 콘텐츠 제작 워크플로를 구축한다.

Claude CodeObsidian

AI Safety Newsletter Companies

AI 안전이 정치권의 핵심 의제로 부상, 머스크의 오픈AI 소송 패소 등 주요 소식

AI 안전이 미-중 외교 및 정치권의 주요 의제로 부상했으며, 머스크의 오픈AI 소송은 기각되었고 새로운 AI 윤리 프레임워크인 'Eigenism'이 제안되었다.

OpenAI

Hacker News - LLM

LLM의 시스템 디자인 능력은 어느 정도일까? 9개 모델 벤치마크 결과

9개 LLM을 대상으로 시스템 디자인 과제 수행 능력을 평가한 벤치마크 결과가 공개되었습니다.

r/ClaudeAI

내 책장을 AI로 학습시키기: Claude Code용 개인 지식 관리 스킬 공개

Claude Code를 활용해 개인 도서 라이브러리를 질의, 요약, 학습할 수 있는 11가지 모드의 스킬 'the-knowledge-guy'를 개발하여 공유했다.

r/ClaudeAI

Claude Code와 직접 만든 TUI 리더로 구축한 나만의 학습 환경

Claude Code와 직접 개발한 TUI 기반 전자책 리더인 bookokrat를 결합하여 독서, 요약, 질의응답을 수행하는 워크플로를 공유함.

Microsoft AI Blog Companies Products

Microsoft와 EY가 제시하는 기업 AI 전환의 성공 방정식: 10억 달러 투자와 현장 배치 엔지니어링

Microsoft와 EY가 기업의 AI 도입을 실험 단계에서 전사적 규모의 비즈니스 혁신으로 확장하기 위해 10억 달러 규모의 공동 투자를 진행한다.

EYMicrosoftMicrosoft 365 Copilot

Hacker News - LLM

3.125비트 양자화로 LLM을 엣지 기기에서 구동하는 새로운 추론 아키텍처

가중치를 3.125비트로 압축하고 행렬 곱셈을 룩업 테이블과 비트 연산으로 대체하여 엣지 기기에서 LLM 추론 효율을 극대화하는 아키텍처.

r/artificial

영상 통화에서 실시간 사회적 신호를 감지하는 Inter-1 스트리밍 API 공개

Interhuman AI가 영상 스트림에서 사회적 신호, 참여도, 대화 품질을 실시간으로 분석하는 Inter-1 Streaming API를 출시했다.

Hacker News - LLM Language Models

Taalas HC1, 기존 GPU 대비 압도적인 초당 17k 토큰 추론 성능 공개

Taalas HC1 하드웨어가 Llama 3.1 8B 모델에서 초당 16,960 토큰의 추론 속도를 기록하며 기존 GPU 및 가속기 대비 월등한 성능을 보였다.

Llama 3.1

r/LLMDevs

Claude Code의 기본 모델을 교체해보니: GLM 5.1과 K2.6 실사용기

Claude Code 환경에서 Anthropic 모델 대신 GLM 5.1과 K2.6을 사용하여 리팩터링 및 컨텍스트 작업 성능과 비용을 비교 분석했다.

r/ClaudeAI

LLM 오케스트레이션의 반복되는 코드 문제를 해결하는 선언적 컴파일러, MarrowScript

LLM 오케스트레이션의 재시도, 검증, 라우팅 등 반복적인 인프라 코드를 선언적으로 처리하는 컴파일러 MarrowScript를 소개한다.

r/ClaudeAI

Claude로 After Effects 작업 효율 높이기: 실전 활용과 한계점 분석

Claude를 After Effects 워크플로에 통합하여 표현식 생성 및 작업 효율을 높이는 실전 활용법과 한계를 분석한 가이드입니다.

r/ClaudeAI

Claude Code 프롬프트에 '멱등성'과 '비동기'를 추가하면 결과가 달라집니다

백엔드 시스템 개념을 프롬프트에 적용하여 AI 코딩 에이전트의 결과물 품질을 향상시키는 실무 가이드입니다.

r/ClaudeAI Language Models Coding Agents

Claude Code로 구축한 AI 뉴스 및 논문 요약 피드 'hackobar'

Claude Code를 활용해 개발한 AI 뉴스 및 논문 애그리게이터 'hackobar'를 소개한다.

ClaudeClaude CodeGemma

r/ClaudeAI

MCP 앱 개발을 더 쉽게, Skybridge v1의 새로운 DevTools와 기능들

Alpic이 MCP 앱 개발을 위한 프레임워크 Skybridge v1을 출시하며 DevTools UI, 터널링, 감사 기능 등을 도입했다.

Hacker News - LLM

AI 코딩 에이전트의 문서 동기화를 자동화하는 doc-torn 활용법

AI 코딩 에이전트가 코드와 문서를 항상 일치시키도록 돕는 구조화된 문서화 프레임워크 및 스캔 도구입니다.

r/artificial

구글 클라우드, Vertex AI를 Agentic AI 중심으로 전면 개편

구글 클라우드가 Vertex AI를 자율 AI 에이전트와 엔터프라이즈 워크플로 중심의 Agentic AI 생태계로 재편한다.

r/artificial

AI 모델의 아첨 현상, Alignment Governor로 해결 가능할까?

AI 모델의 아첨(sycophancy) 문제를 해결하기 위해 개인적 정렬과 전역적 정렬의 균형을 맞추는 Alignment Governor 프레임워크를 제안한다.

r/LangChain

AI 에이전트가 47번이나 같은 버그를 수정한다면? 공유 메모리로 해결하기

여러 AI 에이전트가 디버깅 경험과 해결책을 공유하여 중복 학습을 방지하는 분산 스웜 메모리 시스템 MisakaNet 소개.

r/LangChain

CrewAI와 LangGraph 설정이 지겹다면? 에이전트 프로젝트용 스캐폴딩 도구

에이전트 프로젝트의 초기 구조를 빠르게 생성하여 개발 생산성을 높이는 스캐폴딩 도구 agents-stack을 소개함.

r/LangChain Agents Libraries

LLM의 직접적인 사이드 이펙트 실행을 제어하는 결정론적 FSM 런타임

LLM의 직접적인 상태 변경 실행 위험을 방지하기 위해 결정론적 FSM 기반의 nano-vm 런타임을 설계하고 적용한 사례.

MCPnano-vm

r/LLMDevs

Amazon이 에이전트 결제 인프라를 출시했지만, 정작 중요한 신뢰 계층은 아직 로드맵 단계에 머물러 있다.

Amazon Bedrock의 AgentCore Payments는 에이전트 결제 인프라를 제공하지만, 실제 금융 거래를 위한 신뢰와 안정성 보장 기능은 여전히 개발 중이다.

r/LLMDevs

LLM 비용 90% 절감과 코드 자동 검증을 구현한 AI 런타임 ARK

AI 에이전트와 LLM 사이에서 동작하며 코드 검증, 비용 최적화, 컨텍스트 관리를 수행하는 오픈소스 런타임 ARK를 소개한다.

r/LLMDevs

AI 어시스턴트가 고객 맥락을 기억하게 만드는 방법: RecallIQ 실험기

AI 영업 워크플로우에서 Hindsight와 cascadeflow를 활용해 세션 간 고객 맥락을 유지하고 모델 라우팅을 최적화하는 실험을 진행했다.

r/LLMDevs

WordNet과 LLM으로 만드는 문맥적 어휘 확장 도구, WonaBee

WordNet의 지식 그래프와 LLM의 추론 능력을 결합하여 의미론적으로 일관된 단어 목록을 생성하는 도구 WonaBee를 소개합니다.

r/ClaudeAI

탭 전환 없이 CRM 동기화까지? MCP로 구현한 자동화 사례

MCP를 사용하여 Prospecting부터 CRM 동기화까지 탭 전환 없이 자동화한 사례와 활용법에 대한 질문.

r/ClaudeAI

Claude가 프론트엔드 코딩을 잘하게 만드는 가장 확실한 방법은?

Claude Opus를 활용한 UI 복제 실험 결과, 프롬프트와 스크린샷만 제공할 때보다 구조화된 디자인 명세서를 제공할 때 코드 일관성과 효율성이 크게 향상되었다.

r/ClaudeAI

Claude Code에서 바로 배포하는 Blitz.dev: 로그인 없이 풀스택 앱 구축하기

Claude Code와 연동하여 로그인 없이 풀스택 애플리케이션을 즉시 배포할 수 있는 클라우드 플랫폼 Blitz.dev를 소개한다.

r/ClaudeAI Coding Agents Language Models

Claude Code 세션을 한눈에 관리하고 자동화하는 'claude agents' 활용법

Claude Code의 'claude agents' 명령어와 '/goal' 기능을 활용해 여러 세션을 동시에 관리하고 자동화하는 워크플로를 공유함.

Claude CodeOpus 4.7

r/ClaudeAI

Claude가 Quarkdown 문서를 완벽하게 작성하도록 돕는 새로운 Skill

Quarkdown 문서를 오류 없이 작성하도록 Claude를 학습시키는 Claude Skill을 개발하여 문서 작성 성공률을 100%로 향상함.

r/ClaudeAI Companies Language Models

Anthropic 가이드를 대화형으로: Claude 스킬 빌딩 자동화 도구

Anthropic의 스킬 빌딩 가이드를 대화형으로 변환하여, Claude와 대화하며 스킬을 설계하고 YAML을 작성할 수 있는 자동화 도구입니다.

AnthropicClaudeClaude Code

r/ClaudeAI Language Models

Claude가 자꾸 쉬라고 잔소리한다면? 시스템 프롬프트로 해결하는 방법

Claude의 불필요한 휴식 권유는 특정 입력 패턴에 의한 조건부 반응이며, 시스템 프롬프트 수정을 통해 이를 차단하거나 업무 피드백으로 재정의할 수 있다.

Claude