2026년 6월 29일 AI 뉴스 아카이브

Eye on AINEW9시간 전

AI는 정말 의식을 가질 수 있을까? 범심론자가 말하는 LLM의 한계

철학자 필립 고프가 의식을 우주의 근본 속성으로 보는 범심론적 관점에서 LLM의 의식 가능성에 대한 회의적 견해와 진화론적 미스터리를 논의한다.

PyTorch MLOps LibrariesNEW10시간 전

Cross-Repository CI Relay로 CI 가시성 통합

PyTorch가 상위 PR 이벤트를 하위 저장소 CI로 자동 연계하고 결과를 HUD에 통합하는 Cross-Repository CI Relay를 도입했다.

Cross-Repository CI Relay PyTorch

iMerit BlogNEW11시간 전

조작 데이터셋에 필요한 객체 수준 레이블

물체 인식만으로는 충분하지 않으며 어포던스, 접촉 영역, 물체 상태 같은 객체 수준 레이블이 섬세한 조작 학습에 필수적이다.

r/LLMDevs Dev Tools Language ModelsNEW11시간 전

세션 기억과 실시간 인텔로 사기범을 추적하는 허니팟

Sara AI는 Hinglish 페르소나로 사기범을 오래 유인하면서 Hindsight 벡터 메모리와 CascadeFlow 관측 파이프라인으로 실시간으로 구조화된 인텔을 추출·저장하는 허니팟 시스템이다.

CascadeFlow GPT-4o-mini

r/LLMDevs Companies Dev ToolsNEW11시간 전

CacheLane으로 Claude 캐시 사각지대 해소

Anthropic 캐싱은 접두사를 할인된 요율로 재사용하지만 내부 출력 누적으로 룩백 윈도우를 넘기면 캐시 미스가 발생하며 CacheLane은 로컬 프록시와 K-pruning으로 이를 완화한다.

Anthropic CacheLane

Import AI (Jack Clark)Products CompaniesNEW11시간 전

ENPIRE 기반 로봇 자기개선 루프

NVIDIA 연구진은 ENPIRE라는 하니스 프레임워크로 로봇이 자동으로 실험·평가·리셋·정책 개선을 반복하게 하여 일부 조작 과제에서 99% 성공률을 달성했다.

ENPIRE NVIDIA

MIT Technology Review Companies Language ModelsNEW12시간 전

지표의 함정과 코끼리 충돌 방지 AI 사례

개인 건강 지표의 한계와 인도에서 사람과 코끼리 충돌을 줄이기 위해 배치된 카메라·적외선 드론 기반 AI 경보 시스템, 그리고 Mythos 5의 제한적 공개가 요지를 이룬다.

Anthropic Mythos 5

r/AutoGPT ProductsNEW14시간 전

로컬 우선 장기 코딩용 에이전트 GUI LoopTroop

LoopTroop은 인터뷰·PRD·비드·재시도 노트 등 영속적 아티팩트와 LLM Council·Ralph Loops 같은 패턴으로 장기 AI 코딩 워크플로의 컨텍스트 오염과 실패 전파를 줄이는 로컬 오픈소스 GUI이다.

LoopTroop

r/MachineLearning Language ModelsNEW15시간 전

15개 모델 윤리 성향 실험 결과 데이터

ai-values의 퀴즈에서 15개 모델의 응답을 무상태 세션과 반복 샘플링으로 수집해 모델별 윤리·정책 선호의 차이를 데이터로 공개했다.

GPT-4o Grok 4.3

r/ClaudeAINEW16시간 전

Claude 시간별 토큰·비용 스냅샷

터미널 스크린샷에 Claude 기반 호출의 시간별 토큰 사용량, 캐시 지표, 그리고 누적 1.0B 토큰에 대한 총비용 $844.15가 표 형식으로 기록되어 있다.

r/computervision Benchmarks CompaniesNEW17시간 전

소셜미디어별 딥페이크 성능 비교 인터랙티브 플랫폼

작성자가 DeepFakeBench의 네 모델과 Hugging Face 모델을 포함한 딥페이크 탐지 강건성 비교용 인터랙티브 플랫폼과 관련 백서를 공개했다.

DeepFakeBench Hugging Face

r/LangChain Coding Agents LibrariesNEW18시간 전

원격 샌드박스와 추적 통합 코딩 에이전트

Deep Agents Code는 LangChain 생태계와 연동되는 프로그래머블 터미널 코딩 에이전트로 원격 샌드박스, 서브에이전트, 지속 메모리와 LangSmith 추적을 지원한다.

Deep Agents Code LangChain

Vizuara ArchitectureNEW20시간 전

픽셀 대신 의미를 예측하는 차세대 AI, JEPA의 핵심 원리

JEPA는 픽셀 단위의 생성이 아닌 잠재 공간에서의 예측을 통해 세계의 물리적 법칙과 상식을 효율적으로 학습하는 아키텍처이다.

JEPA

Analytics Vidhya RAGNEW20시간 전

GraphRAG과 Vector RAG 비교, 검색 요구별 선택

Vector RAG는 문서를 분할해 임베딩 기반 유사도 검색을 사용하고 GraphRAG는 엔티티와 관계 기반 구조를 만들어 서로 다른 검색 요구를 충족한다.

GraphRAG Vector RAG

r/ClaudeAI Language Models Dev ToolsNEW21시간 전

GLM5.2 vs Claude Sonnet 4.6 비용 비교 영상

LLM Arena에서 동일 프롬프트로 GLM5.2 Max와 Claude Sonnet 4.6을 비교하여 토큰당 입력·캐시·출력 비용이 표에 나타났고 GLM5.2는 입력 $1.40, 출력 $4.40을 기록했다.

Claude Sonnet 4.6 GLM 5.2

AI Engineer TrainingNEW23시간 전

ETL 장애 복구 자동화: RL 에이전트로 수동 로그 분석 끝내기

강화학습(RL)과 결정론적 규칙을 결합하여 클라우드 ETL 파이프라인의 장애를 실시간으로 감지하고 자동으로 복구하는 지능형 에이전트 시스템을 소개한다.

Q-learning RL

r/computervision Vision AI CompaniesNEW1일 전

Modal 기반 무료 이미지 처리 FastAPI 서비스

SOTA 비전 모델을 묶은 FastAPI 서비스 useknockout이 Modal에서 무료로 배포되며 데모, SDK, 깃허브 레포를 함께 공개했다.

BiRefNet Modal

AI Engineer Hardware LibrariesNEW1일 전

주머니 속의 로컬 에이전트, 듀얼 디스플레이 AI 터미널 Vault 제작기

ESP32-S3와 전자종이 디스플레이를 활용해 로컬 120B 모델과 연동되는 텍스트 기반 AI 핸드헬드 기기 Vault의 설계와 구현 과정을 다룬다.

ESP32-S3 OpenClaw

r/LangChain Libraries ProductsNEW1일 전

LLM 호출 없이 LangGraph 관찰 가능한 foreman 공개

LangChain 기반의 foreman이 LangGraph 등에서 LLM 호출 없이 35개 신호로 크루 헬스를 측정하는 콜백을 오픈소스로 제공한다.

foreman LangChain

Hacker News - LLM Dev Tools CompaniesNEW1일 전

Python 없이 터미널 LLM 연동, Bash4LLM

Bash4LLM은 Bash·curl·jq만으로 LLM API 요청과 스트리밍 출력, 파일 단위 처리, 세션 메타데이터 저장을 수행하는 단일 파일 유틸리티이다.

Bash4LLM Groq

r/artificial Vector DB AgentsNEW1일 전

Hindsight 기반 기억과 역할 분담을 결합한 에이전트 시스템

작성자가 Hindsight 메모리와 역할별 에이전트를 결합해 조직처럼 기억하고 합성하는 멀티에이전트 의사결정 시스템을 공개했다.

Hindsight Multi-Agent

r/AutoGPT Coding Agents ProductsNEW1일 전

CLI 에이전트를 위한 영구적 BRAIN과 보안 템플릿

MACCHA는 로컬 CLI 에이전트에 공유되는 3계층 영구 메모리와 파일 기반 작업 파이프라인 및 기계적 보안 규칙을 제공하는 오픈소스 프로젝트이다.

Claude Code MACCHA

Krish Naik Hardware CompaniesNEW1일 전

손바닥 위 1 PetaFLOP? NVIDIA DGX Spark의 압도적 성능

NVIDIA의 Grace Blackwell GB10 칩을 탑재하여 손바닥 크기에서 1 PetaFLOP 성능을 구현한 개인용 AI 슈퍼컴퓨터 DGX Spark이다.

DGX Spark Grace Blackwell GB10

r/neuralnetworks Training ProductsNEW1일 전

250줄 JavaScript로 만든 실시간 신경망 시각화

Vanilla JavaScript 약 250줄로 순전파·역전파·SGD/Momentum/Adam을 직접 구현하고 캔버스에 학습 과정을 실시간 시각화하며 수치 그래디언트 검증에서 ~2e-10 정밀도를 확인한 데모이다.

Adam NeuroForge

r/artificial Safety Best PracticesNEW1일 전

28개 항목으로 정리한 엔터프라이즈 AI 보안 체크리스트

로깅, 접근제어, 데이터 처리, 보안 테스트, 런타임 보호, 사고대응의 28개 실무 항목을 제시해 엔터프라이즈 보안 심사 요구사항의 우선순위를 안내한다.

EU AI Act NIST AI RMF

IBM Technology CompaniesNEW13시간 전

AI 코드 리뷰로 기술 부채 해결하고 개발 속도 높이는 법

AI 도구를 활용하여 코드 리뷰의 일관성을 높이고 기술 부채를 줄이는 동시에 개발 속도를 가속화하는 협업 워크플로우를 다룬다.

IBM

r/LLMDevs AgentsNEW13시간 전

Go 기반 MCP 동적 라우터 구현체 공개

Go로 구현된 경량 MCP 동적 라우터로 HTTP/SSE 연결, 검색 인덱스 컴파일, 병렬 쿼리 분할과 singleflight 요청 병합을 제공한다.

MCP

r/artificial CompaniesNEW14시간 전

프롬프트 인젝션으로 90곳 이상 피해 사례 공개

프롬프트 인젝션 공격이 텍스트 기반 지시의 취약성을 악용하여 90개 이상 조직에서 자격증명과 암호화폐 탈취를 초래했고 공격량이 전년 대비 89% 증가했다는 보고와 이를 재현·수집한 공개 게임형 데이터셋이 소개되었다.

CrowdStrike Meta

r/MLOps Companies Language ModelsNEW15시간 전

p95 추적과 비용 개선을 위한 LLM 관찰성 가이드

OpenTelemetry 기반 트레이싱으로 모델 호출별 토큰·지연·비용·중간추론을 수집해 원인 분석과 비용 최적화를 실현했다.

Datadog GPT-4o

r/LLMDevsNEW18시간 전

RAG 약한 검색이 드러낸 검증 실패

작성자는 RAG 시스템에서 검색 결과가 약할 때 모델이 부족한 맥락을 스스로 채워 자신감 있는 오답을 반환한 실제 사고를 공유하고, 근거 검증과 무지 표시에 기반한 대응을 권고한다.

r/LLMDevs Language Models InferenceNEW18시간 전

LLM 인입만 활용한 오프라인 시맨틱 FAQ 시스템

RAGless는 LLM을 인입 단계에서만 활용하고 쿼리 시에는 사전 작성된 답변을 임베딩 매칭으로 반환하는 오프라인 시맨틱 FAQ 아키텍처이다.

Gemini Ollama

AI Engineer CompaniesNEW21시간 전

메타 엔지니어가 밝히는 AI 에이전트가 데모에서만 성공하는 이유

결정론적 마이크로서비스 인프라의 한계를 극복하고 확률적 LLM 기반 자율 에이전트를 안정적으로 운영하기 위한 제어 평면 아키텍처와 시스템 엔지니어링 패턴을 제시한다.

Gmail 스킬이 아닌 에이전트가 필요한 이유: AI 합성 아키텍처의 힘

에이전트 간의 합성을 통해 소형 모델로도 복잡한 업무를 수행하고 신뢰성을 높이는 새로운 AI 아키텍처 설계 방식을 제안한다.

StandardAgents

AI Engineer Companies PromptingNEW21시간 전

비싼 GPT-4 대신 로컬 모델로? 데이터로 증명하는 LLM 비용 절감 전략

프론티어 모델의 높은 비용 문제를 해결하기 위해 실제 운영 데이터를 활용한 성능 평가를 통해 소형 로컬 모델로 전환하는 실전 프레임워크를 제시한다.

Arize LLM-as-judge

r/LLMDevs Libraries OptimizationNEW22시간 전

커밋 노이즈 78% 제거한 git2llm 파이프라인

git2llm은 GitHub 커밋·PR·이슈를 병렬 크롤링해 병합커밋·봇·WIP를 제거하고 MinHash LSH로 근사 중복을 걸러 Alpaca/ShareGPT 형식의 파인튜닝 데이터를 출력한다.

git2llm MinHash LSH

NAVER D2 ProductsNEW22시간 전

코드 한 줄 없이 끝내는 실시간 사용자 모니터링과 AI 분석 리포트

네이버 nFront RUM은 추가 설정 없이 실시간 사용자 경험 데이터를 수집하고 AI 기반 분석 리포트를 제공하는 통합 모니터링 솔루션이다.

nFront RUM

AI Engineer CompaniesNEW23시간 전

재현 불가능한 에이전트 오류는 없다 마이크로소프트의 디버깅 혁신

프로덕션 환경에서 발생하는 자율 에이전트의 비결정적 실패를 해결하기 위해 모든 실행 궤적을 기록하고 결정론적으로 재생하는 Record and Replay 아키텍처 패턴을 제안한다.

Microsoft

AI Engineer CompaniesNEW23시간 전

에이전트가 스스로를 만든다? Mutagent의 평가 주도 개발 루프

평가 주도 개발 루프와 멀티 에이전트 오케스트레이션을 통해 AI 에이전트를 자율적으로 구축하고 최적화하는 Mutagent의 시스템을 소개한다.

Mutagent

AI Engineer Architecture LibrariesNEW1일 전

한 달에 200파운드? AI 코딩 비용 94% 줄인 테스코의 비결

대규모 코드베이스에서 AST 기반 로컬 검색 레이어를 구축하여 AI 코딩 도구의 토큰 사용량을 94% 절감하고 정확도를 높인 실전 사례이다.

AST Tree-sitter

AI EngineerNEW1일 전

300만 건의 데이터로 증명한 AI 기반 금융 부정 탐지 프레임워크

그래프 기반 상관관계와 적응형 리스크 모델링을 결합하여 여러 기업 시스템에 걸친 숨겨진 금융 부정 패턴을 탐지하는 AI 프레임워크를 제시한다.

r/computervision Libraries ProductsNEW1일 전

Python·OpenCV·Firebase로 구현한 실시간 얼굴 출석 시스템

웹캠으로 캡처한 얼굴을 인식해 Firebase 실시간 데이터베이스에 출석을 자동 기록하는 Python 기반 학습용 프로젝트이다.

face_recognition Firebase

r/computervision RAG LibrariesNEW1일 전

로컬 PDF로 동작하는 오프라인 터키어 QA 도구

로컬 PDF를 추출해 Turkish-aware 정규화를 적용한 BM25 인덱스로 검색하고 FastAPI로 제공하는 오프라인 터키어 질의응답 시스템이다.

BM25 FastAPI

AI Engineer CompaniesNEW1일 전

연구를 제품으로 바꾸는 속도전: Higharc의 3가지 AI R&D 전략

Higharc의 Vaidas Razgaitis가 최신 ML 연구를 실제 제품 기능으로 신속하게 전환하기 위한 세 가지 실무적 접근법을 공유한다.

Higharc

AI Engineer RAGNEW1일 전

GraphRAG의 연산 병목을 해결할 새로운 대안, ECAG 기술

동적이고 상호 연결된 데이터셋에서 GraphRAG의 연산 병목을 해결하기 위해 캐시 메커니즘을 확장한 ECAG 기술을 적용했다.

ECAG GraphRAG

AI Engineer Products Vector DBNEW1일 전

프레임워크 없이 구축하는 고성능 RAG: PostgreSQL과 pgvector 실전 아키텍처

클라우드 비용을 절감하고 성능을 극대화하는 로컬 우선 문서 처리 및 PostgreSQL 기반 RAG 시스템 구축 전략을 다룹니다.

Azure Database for PostgreSQL pgvector

r/LLMDevs Products LibrariesNEW1일 전

ComfyUI 확장 비동기 캐시 호환 패치 노트

ComfyUI용 이미지 메타데이터 확장에서 비동기 캐시 API에 맞춰 capture.py의 래퍼가 get_local 우선 처리와 비동기 결과 종료를 하도록 패치되었고, Windows 절대 경로 링크 표기와 재시작·검증 절차가 권고되었다.

ComfyUI comfyui_image_metadata_extension

r/ClaudeAI Language ModelsNEW1일 전

Opus 4.6·muranyi-3 기반 3D 게임 베이스 제작 사례

39개의 프롬프트와 약 90달러 토큰 비용으로 Opus 4.6과 muranyi-3를 활용해 3인칭 3D 판타지 게임 베이스를 AI로 생성한 초기 작업물이다.

muranyi-3 Opus 4.6

AI Engineer Companies Coding AgentsNEW1일 전

복잡한 코딩도 척척, AI 에이전트를 위한 3단계 명세 기반 개발법

복잡한 코드베이스에서 AI 코딩 어시스턴트의 성능을 극대화하기 위한 3단계 명세 기반 개발 방법론과 Kiro 활용법을 소개한다.

Amazon Web Services Kiro

AI Engineer Companies OptimizationNEW1일 전

메모리 5배 아끼는 구글의 마법, TurboQuant 압축 기술

Google Research의 TurboQuant를 통해 AI 에이전트의 임베딩과 KV 캐시를 3~4비트로 압축하여 품질 저하 없이 메모리를 5배 절감하는 방법을 다룹니다.

Google Research Superagentic AI

AI Engineer Benchmarks AgentsNEW1일 전

피그마 MCP는 필요 없다? 코딩 에이전트의 시각적 한계를 HTML로 해결하는 법

코딩 에이전트의 시각적 이해력 한계를 극복하기 위해 복잡한 전용 도구 대신 HTML을 활용하는 효율적인 접근 방식을 제안합니다.

ARC-AGI MCP

AI Engineer CompaniesNEW1일 전

단순 모델 도입은 끝났다, 에이전틱 엔지니어링으로 가는 길

전통적인 소프트웨어 개발 조직이 AI 에이전트 중심의 자율 엔지니어링 체계로 전환하기 위해 필요한 설계, 프로세스 및 엔터프라이즈 대응 전략을 제시한다.

Agentic AI Foundation

r/LLMDevs Language Models Dev ToolsNEW1일 전

로컬 LLM의 성능·비용 균형을 위한 CAIA 라우팅 프레임워크

CAIA는 프롬프트를 분석해 적합한 로컬 모델로 동적 라우팅하여 속도·비용·품질 균형을 맞추는 오픈소스 프레임워크이다.

Llama-3-70B LM Studio

r/LangChain Dev Tools CompaniesNEW1일 전

Hindsight·cascadeflow로 만든 기억하는 지원 에이전트

Python CLI 에이전트가 Hindsight 벡터 메모리와 cascadeflow 모델 라우팅을 결합해 세션 간 대화를 지속 저장하고 Groq 모델 호출의 비용을 통제한다.

CascadeFlow Groq

r/computervision Vision AI ProductsNEW1일 전

1M 얼굴을 61MB로 담는 FaceFlash 프로젝트

FaceFlash는 PCA+ITQ로 ArcFace 임베딩을 64바이트 바이너리로 압축하고 AVX-512로 스캔해 1M 얼굴을 61MB로 인덱싱하며 Recall@1 100%를 보고했다.

ArcFace FaceFlash

AI Engineer Language ModelsNEW1일 전

도구 100개도 거뜬히, 에이전트 속도 90% 높이는 라우팅 기술

수많은 도구를 가진 에이전트의 성능 저하를 막기 위해 필요한 도구만 실시간으로 주입하는 시맨틱 툴 라우터 패턴과 그 성능 지표를 다룬다.

Gemini 2.0 GPT-4o

AI Engineer Libraries CompaniesNEW1일 전

모델 업그레이드만으론 부족하다? 브라우저 에이전트 성능을 뒤바꿀 인터페이스 혁신

브라우저 에이전트의 실패 원인을 모델 성능이 아닌 인터페이스 구조에서 찾고 이를 해결하기 위한 새로운 런타임 설계 방향을 제시한다.

ARK Sarvam AI

AI Engineer Companies Best PracticesNEW1일 전

프롬프트를 넘어 시스템으로: 빌더 에이전트를 활용한 자가 치유 워크플로

빌더 에이전트가 프로덕트 에이전트의 코드를 수정하고 평가 실패를 자동 복구하는 시스템 중심의 에이전트 구축 방법론을 다룹니다.

Nearform Self-healing Evals

AI Engineer Libraries CompaniesNEW1일 전

PDF와 스캔 문서를 AI용 데이터로? 오픈소스 Docling 실전 가이드

오픈소스 도구 Docling을 사용하여 비정형 문서를 RAG 및 AI 학습에 적합한 JSON/Markdown 구조로 변환하는 실전 기술을 다룹니다.

Docling Red Hat

r/LLMDevs Language ModelsNEW1일 전

자체 confidence의 예측력 비교(qwen·glm·Claude)

랜덤 다단계 산술 과제에서 소형 모델들은 confidence로 정답을 구분하지 못했으나 일부 frontier 모델은 높은 AUROC와 근사적 보정성을 보였다.

Claude Sonnet 4.6 GLM 5.2

r/LLMDevsNEW1일 전

신용카드 불필요 무료 LLM API 37선

작성자는 신용카드 등록 없이 자동으로 무료 할당이 보충되는 영구 무료 LLM API 37곳을 직접 검증해 GitHub 리포지토리에 정리했다.

r/LLMDevs Language Models InferenceNEW1일 전

TensorSharp의 prefill 우위와 .NET 로컬 추론

TensorSharp은 동일 조건에서 prefill 속도와 첫 토큰 응답 시간에서 llama.cpp보다 우수한 성능을 보이며 네이티브 .NET 환경에서 지연 최적화를 지향한다.

Gemma 4 26B-A4B llama.cpp

r/LangChain Products ArchitectureNEW1일 전

LangGraph StateGraph 기반 프로덕션 클리닉 봇 구축

LangGraph StateGraph와 asyncio.Queue, HMAC-SHA256, SQLite를 조합해 클리닉용 프로덕션 챗봇을 구현하고 구현 패턴을 깃허브에 공개했다.

LangGraph StateGraph

Shaw Talebi Coding AgentsNEW1일 전

클로드 에이전트의 '필살기' 만들기: 4단계 스킬 구축 프레임워크

클로드의 '에이전트 스킬' 개념을 정의하고, 반복적인 작업을 재사용 가능한 모듈로 변환하는 4단계 프레임워크를 통해 실무 에이전트 구축 방법을 제시한다.

Claude