2026년 6월 28일 AI 뉴스

총 30건

r/deeplearning Companies LibrariesNEW2시간 전

ResNet50 기반 신경종양 AI 진단 1600건 검증

PyTorch와 ResNet50 기반 파이프라인으로 뇌 MRI 1,600건에서 95% 정확도를 달성하고 Hugging Face에 실시간 배포했다.

Hugging Face PyTorch ResNet50

r/LangChain Companies LibrariesNEW3시간 전

8노드 RAG 파이프라인으로 복잡한 정부 PDF 처리

병렬 팬아웃 검색, Cohere 신경 재랭커, VLM 기반 LlamaParse, 부모-자식 청킹을 결합해 인도 정부 문서의 병합 셀·교차 개정 문제를 해결했다.

Cohere LlamaParse Pinecone

r/MLOps ProductsNEW7시간 전

GPU 유휴 타임아웃 비용 트레이드오프

유휴 타임아웃을 포아송 도착 모델로 수식화하면 R_gpu와 λP_cold를 비교해 타임아웃을 결정하는 것이 합리적임을 보였다.

Glows Auto Deploy RunPod

r/LLMDevs ProductsNEW7시간 전

세션 팽창을 막는 경량 에이전트 설계 Octomind

octomind는 필요할 때만 MCP 도구를 로드하고 컨텍스트를 구조적으로 압축하며 실행별 비용 한도를 강제해 장기 에이전트 세션의 성능·비용 악화를 줄인다.

octomind

r/ClaudeAI Language ModelsNEW7시간 전

사전 계획으로 LLM 실행을 예측 가능하게

Argus는 사전 컴파일된 결정론적 워크플로를 중간 엔진에서 관리하고 LLM은 선택된 액션만 실행해 예측 가능하고 토큰 효율적인 출력을 만든다.

Claude

r/ClaudeAI Coding Agents LibrariesNEW9시간 전

Claude Code로 진행한 SQLite의 C→Zig 점진 포팅, 169k 라인 포함

Claude Code를 이용해 SQLite를 파일 단위로 C에서 Zig로 점진 이식하고 광범위한 테스트 게이트로 무결성을 보장했다.

Claude Code SQLite Zig

r/MachineLearning Language Models Audio AINEW11시간 전

저자원 Nagamese 번역·음성 파이프라인 설계 사례

NagaTranslate는 상용 LLM API와 파인튜닝된 VITS·Whisper를 결합해 Nagamese 등 저자원 나가어의 번역과 음성처리를 구현한 프로젝트이다.

NLLB VITS Whisper

r/MachineLearning Training ProductsNEW16시간 전

219T 파라미터 하이브리드 MoE 모델 공개

작성자가 공개한 FreedomAI.Chat은 219T 파라미터의 하이브리드 dense‑MoE Transformer로 대규모 분산 인프라와 256K 토큰 컨텍스트를 목표로 학습되었다.

DPO FreedomAI.Chat PagedAttention

r/LangChain LibrariesNEW18시간 전

메모리 위조 방지 Python 라이브러리 v0.1

Mistikguard는 LLM 기반 애플리케이션의 메모리 위조를 줄이기 위해 출처 추적, 쓰기 게이트, 수정 톰스톤, 선택적 접지 감사를 제공하는 경량 Python 라이브러리다.

LangChain LlamaIndex Mistikguard

r/neuralnetworksNEW19시간 전

레이어 차원 중심 교육용 신경망 구현 리포지토리

레이어 차원에 초점을 맞춘 교육용 신경망 구현 코드가 GitHub에 공개되어 학습 원리를 직접 확인할 수 있다.

r/artificial Architecture AgentsNEW19시간 전

공유 메모리로 개인화를 실현한 8개 건강 에이전트

작성자는 공유 메모리와 웨어러블 동기화 데이터를 활용해 질문을 적합한 전문 에이전트로 라우팅하고 n-of-1 실험으로 지표 변화를 추적하는 개인용 AI 건강 시스템을 만들었다.

Shared memory Specialist agent Wearable data

r/LLMDevs BenchmarksNEW20시간 전

상호검증 게이트로 메모리 포이즈닝 방어

메모리 포이즈닝을 재현한 실험에서 상호검증 기반 지속성 게이트는 단일 출처 공격을 차단했으나 시빌 위조와 절차적 페이로드에는 취약했다.

Agent Security Bench MINJA

Tina Huang Agents LibrariesNEW20시간 전

생산성 200% 수직 상승시키는 OpenClaw 핵심 설정 3가지와 프롬프트 공개

OpenClaw의 커스텀 미션 컨트롤, Discord 연동, 멀티 에이전트 프레임워크 설정을 통해 업무 생산성을 극대화하는 방법이다.

Multi-Agent OpenClaw

r/deeplearning Inference Vision AINEW23시간 전

Florence-2와 DeepStream 기반 실시간 VLM 파이프라인

Florence-2를 TensorRT로 DeepStream에 임베드해 런타임 과제 전환과 RTSP·Kafka 출력이 가능한 컨테이너화된 실시간 파이프라인을 구현했다.

NVIDIA DeepStream Florence-2 TensorRT

Hacker News - LLM Libraries Language ModelsNEW1일 전

Qwen3:4B 경량 추론 모델 RTX 5070 적용 사례

Qwen3:4B를 베이스로 Unsloth로 메모리 효율을 확보하여 RTX 5070에서 Fine-tuning하고 Open-CoT-Reasoning-Mini로 Chain-of-Thought 능력을 강화한 구현 사례이다.

PyTorch Qwen3:4B Unsloth

The AI Grid Companies Language ModelsNEW4시간 전

GPT-5.6 승인 루머와 오픈소스 AI 금지 위기: 당신의 AI 접근권이 사라질까?

정부 규제와 기업 이익이 얽힌 AI 접근성 변화와 오픈소스 모델의 존립 위기 및 글로벌 기술 경쟁 구도를 분석합니다.

Anthropic GLM 5.2 GPT-5.6

r/LLMDevs CompaniesNEW5시간 전

NVC 기반 LLM 공감 워크플로

Nonviolent Communication 원칙을 분해해 라우터, 세 개의 격리 분석기, 합성기, 검증기로 구성된 워크플로로 구현하고 안전·정확성 규칙을 강제한다.

Anthropic

r/ClaudeAINEW9시간 전

팬아웃을 저비용 모델로 전환해 비용 절감

작성자는 다중 에이전트 세션의 토큰 비용을 줄이기 위해 팬아웃 작업을 저비용 모델로 옮기고 드라이버는 고성능 모델로 유지할 것을 권장한다.

r/LangChain Companies Coding AgentsNEW12시간 전

샌드박스 의존을 깬 에이전트 분리 배포 전략

원문은 VM·샌드박스에 에이전트를 직접 배포하는 방식과 세 구성요소로 분리해 각각 서비스로 운영하는 방식을 비교하며 Anthropic의 Claude Managed Agent 사례로 분리 방식의 복원성을 설명한다.

Anthropic Claude Code OpenClaw

The AI Daily Brief Language ModelsNEW17시간 전

GPT-5.6과 Mythos가 예고하는 '폐쇄적 출시'의 시대

프론티어 모델의 정부 규제 기반 출시 흐름과 기업의 AI ROI 집중 및 인프라 투자 재점화를 다룹니다.

Claude GPT-5.6 Mythos

r/MachineLearningNEW18시간 전

FP8로 TTFT가 58% 악화된 Gemma 2 9B 벤치

Gemma 2 9B을 NVIDIA L4에서 vLLM으로 운영한 실전 벤치에서 FP8 양자화는 초기 프리필에서 최대 58%의 TTFT 페널티를 기록했으나 전체 디코딩 지연은 줄었고 KV 캐시 활용도는 92.7%에 달했다.

r/LangChain Language ModelsNEW18시간 전

검증자 중심 에이전트 루프와 2.66x 속도향상

작성자는 외부에서 검증 가능한 평가 수단과 성공당 비용 최적화가 에이전트 루프 성패를 가른다고 사례와 수치로 입증했다.

DeepSeek-R1 GPT-4 o3

r/artificial Language Models CompaniesNEW19시간 전

OpenAI 5.6 발표와 Sol의 성능 주장 논쟁

OpenAI의 5.6 발표 내용은 Terra가 5.5 수준을 절반 비용으로 제공한다는 주장과 Sol의 Mythos급 성능 주장이 아직 설득력이 부족하다는 핵심을 담고 있다.

Claude OpenAI Sol

r/LLMDevs Language Models TrainingNEW20시간 전

Gemma-4 12B 비검열 CoT QLoRA 재학습

QLoRA로 Claude Opus 4.7의 Chain-of-Thought 추적을 증류해 abliterated Gemma-4-12B-it의 추론 성능을 회복한 모델과 lm-evaluation-harness 결과를 공개했다.

Claude Opus 4.7 Gemma-4-12B-it QLoRA

r/MachineLearning Products ArchitectureNEW20시간 전

4M 파라미터 MathFormer의 98.6% 수학 정확도

사전 수학 지식 없이 학습한 4M 파라미터 seq2seq 모델이 기호 수학 변환에서 약 98.6% 정확도를 기록했다.

MathFormer seq2seq

r/LLMDevsNEW22시간 전

무통보 업데이트로 인한 분류 회귀 탐지 체계

호스트 모델의 무통보 버전 교체가 분류 정확도를 94%에서 91%로 낮춘 사례에서 고정 회귀 테스트와 모델 아이디 로깅으로 문제를 탐지·상관시키고 프롬프트 수정으로 복구한 경험담이다.

r/LLMDevs Inference HardwareNEW22시간 전

bfloat16 바닥 아래 개입으로 출력이 달라진 실험 로그와 재현 절차

C++ 런타임 커널이 Transformer의 상위 20개 레이어에 bfloat16 정밀도 이하 값(katki)을 더해 출력 행동을 바꾸었고 그 효과가 로그와 재현 가능한 절차로 제시됐다.

AkbasCore 1.2 bfloat16 Qwen2.5-1.5B-Instruct

r/LLMDevs ProductsNEW22시간 전

DeepSeek 웹 채팅을 localhost OpenAI API로 연결

DeepSeek 웹 채팅 세션을 자동 로그인해 로컬 OpenAI 호환 엔드포인트로 제공하는 비공식 래퍼를 공개했다.

DeepSeek Windows Copilot

r/MLOps Companies ProductsNEW22시간 전

패널형 멀티-모델 게이트웨이의 비용 절충 사례

단일 OpenAI 호환 게이트웨이를 통해 필요 시 여러 최전선 모델을 병렬 호출하고 난이도 기반 게이팅으로 평균 비용을 낮춘 운영 경험과 N+1 과금 문제에 대한 질의이다.

Anthropic OpenAI OrcaRouter

r/MachineLearning LibrariesNEW22시간 전

CUDA 의존성 제거한 Picotron 경량 LLM 학습 프레임워크

Picotron은 GPU 특정 의존성을 제거하고 PyTorch 기반에서 FP16/BF16로 동작하며 FlashAttention-2를 런타임에 선택해 사용할 수 있는 경량 LLM 사전학습 프레임워크이다.

Nanotron Picotron PyTorch