2026년 6월 30일 AI 뉴스 아카이브

r/neuralnetworks Architecture Language ModelsNEW11시간 전

Qwen3.5-35B에서 드러난 Expert 114 경험적 축

Qwen3.5-35B의 MoE에서 전문가 114가 반성적·내적 관점 서술에서 강한 활성 신호를 보였다.

Mixture of Experts (MoE)Qwen3.5-35B

Roboflow Blog Vision AINEW11시간 전

RF-DETR 기반 자동 드론 출동 보안 시스템

PTZ 카메라와 드론 영상을 MediaMTX로 중계해 2초마다 프레임을 RF-DETR에 전송하고 ByteTrack·PolygonZone으로 침입을 확인해 자동으로 드론을 출동시킨다.

RF-DETR

KDNugget ArchitectureNEW12시간 전

MCP 서버로 도구 발견·호출 표준화

MCP 서버로 도구를 한 번 등록하면 모든 MCP 호환 클라이언트와 모델, 프레임워크가 추가 통합 코드 없이 자동으로 해당 도구를 검색하고 호출할 수 있다.

MCP

NVIDIA - Deep Learning Blog Products LibrariesNEW12시간 전

엣지 비전 AI의 병목과 실용적 워크플로

NVIDIA는 OpenUSD와 Omniverse 기반 합성 데이터와 Metropolis의 에이전트 스킬을 통해 엣지 비디오를 운영 인사이트로 전환하는 반복 가능한 학습·배포 워크플로를 제시한다.

NVIDIA Metropolis NVIDIA Omniverse

Siraj Raval Language Models ArchitectureNEW13시간 전

9,000개 앱을 Claude에 연결하는 마법, Zapier MCP 실전 활용법

Zapier MCP를 통해 Claude 에이전트가 9,000개 이상의 앱과 직접 연동되어 CRM 관리부터 결제까지 비즈니스 전반을 자동화하는 워크플로와 한계를 다룬다.

Claude MCP

Gradient Flow (Ben Lorica)Products RAGNEW13시간 전

Elemental로 엔터프라이즈 데이터의 컨텍스트 그래프 자동화

Lovelace의 Elemental은 테이블·PDF·뉴스·JSON·위성영상 등 다양한 데이터를 공통 중간 표현으로 변환해 에이전트가 탐색 가능한 컨텍스트 그래프를 자동으로 구축하고 유지한다.

Elemental GraphRAG

LangChain Vector DB LibrariesNEW13시간 전

8,700만 승객 데이터를 지식 그래프로: LATAM 항공의 AI 에이전트 스케일업 전략

LATAM 항공이 LangGraph 기반 에이전트를 통해 비용을 15% 절감하고, 비정형 대화 데이터를 BigQuery 지식 그래프로 자산화한 실전 아키텍처를 공유한다.

BigQuery LangGraph

r/MachineLearning Datasets EmbeddingsNEW13시간 전

SPECTER 2와 UMAP로 만든 1100만 논문 연구지도

OpenAlex와 arXiv의 약 1100만 논문을 SPECTER 2 임베딩으로 인코딩하고 UMAP으로 2차원에 투영해 보로노이 기반 인터랙티브 연구 지도를 만든 프로젝트이다.

OpenAlex SPECTER 2

MIT Technology Review CompaniesNEW13시간 전

‘AI 직원’ 귀속의 실험적 한계

연구에서 관리자들은 'AI 직원'으로 귀속된 작업에서 오류를 18% 더 적게 발견했고, 스트라토스피어 기반 HAPS가 18km 고도에서 5G 보강 시험을 준비하고 있다.

Anthropic Google

r/neuralnetworks Language ModelsNEW15시간 전

LIMEN 연구로 드러난 Transformer의 보편 동적 문법

LIMEN은 은닉 상태 궤적의 기하와 이산적 전이에서 보편적 전이 모티프와 맥락 의존적 동적 변화를 규명했다.

GPT-2 Llama-3.2-1B

AI Jason Coding Agents ProductsNEW15시간 전

AI 에이전트의 코딩 실력을 200% 높이는 코드베이스 하네스 구축법

AI 에이전트가 코드베이스를 정확히 이해하고 스스로 수정할 수 있도록 돕는 코드베이스 하네스 개념과 Skill 라이브러리 활용법을 소개합니다.

skills Superdesign

r/MachineLearning Safety OptimizationNEW15시간 전

Qwen3.6-35B MoE용 norm-preserving abliteration 공개

작성자는 norm-preserving biprojection을 적용해 Qwen3.6-35B-A3B에서 거부 방향을 제거하면서 벤치마크 저하 없이 보류된 테스트에서 거부율을 0%로 만들었다.

Abliteration norm-preserving biprojection

MIT Technology Review CompaniesNEW15시간 전

구글·OpenAI·NVIDIA가 모인 취리히의 R&D 집중과 투자 지형

구글·OpenAI·NVIDIA 등 글로벌 테크 기업이 취리히에 밀집해 있으며 이 지역은 높은 특허·R&D 투자와 딥테크 중심의 벤처 자본 구조를 보인다.

Google NVIDIA

r/LLMDevs Dev ToolsNEW16시간 전

셀프호스트 웹 검색 스킬 browser-search

browser-search는 SearXNG, Camofox, CloakBrowser를 결합해 에이전트의 웹 검색과 브라우징을 자체 호스팅으로 처리하며 Readability.js로 토큰 사용을 크게 절감한다.

Camofox CloakBrowser

엥지유니버스 Domain AI ArchitectureNEW16시간 전

급변하는 로봇 AI 시대, 시스템 설계로 꿰뚫는 Physical AI의 핵심

Physical AI의 최신 기술 스택과 시스템 관점을 정리한 신간 소개와 함께, 로봇이 학습하고 판단하며 행동하는 기술적 흐름을 조망한다.

Physical AI VLA

r/LangChain Libraries CompaniesNEW17시간 전

LangChain 에이전트 운영 실패 사례와 30% 세션 손실

LangChain 기반 에이전트 운영에서 로그에 잡히지 않는 침묵 실패가 30% 수준으로 발생했고 대시보드와 비용 분리 설계의 한계가 $2400 비용 손실로 이어져 초기부터 관찰성과 비용 귀속을 설계하게 되었다.

LangChain OpenAI

r/LanguageTechnology Dev Tools LibrariesNEW19시간 전

Rust·WASM으로 구현한 spaCy 파이프라인 100% 일치 사례

spaCy en_core_web_md 파이프라인을 Rust로 재구현해 WebAssembly로 컴파일한 단일 HTML 데모를 통해 로컬 실행과 spaCy 원본과의 거의 완전한 출력 일치를 보고했다.

Rust spaCy

r/LLMDevs Libraries Language ModelsNEW20시간 전

가역적 로컬 de-id 레이어 벤치마크 포함

로컬 모델로 식별자 스팬을 탐지해 결정론적 대체와 로컬 역전맵을 유지하는 de-id 레이어 프로젝트이다.

Presidio Qwen

VizuaraNEW20시간 전

텍스트 생성의 새로운 패러다임, 디퓨전 언어 모델의 핵심 원리

이미지 생성의 디퓨전 원리를 텍스트에 적용하여 노이즈로부터 문장을 복원해내는 새로운 언어 모델링 기법이다.

NAVER D2 Coding Agents CompaniesNEW1일 전

Claude Code의 한계를 넘는 네이버의 AI 에이전트 플랫폼 NaverMadCat

Claude Code의 환경 휘발성 문제를 해결하고 10개 부서 에이전트 조직을 통해 지속 가능한 협업 체계를 구축한 NaverMadCat 플랫폼의 설계 노하우를 공유한다.

Claude Code NAVER

SambaNova Systems Hardware CompaniesNEW1일 전

Nvidia B200보다 2배 빠른 하이브리드 추론 시스템의 등장

Nvidia B200과 SambaNova SN40을 결합하여 기존 대비 2배 빠른 추론 속도를 구현한 하이브리드 아키텍처 데모이다.

B200 SambaNova

r/MLOps Hardware ProductsNEW1일 전

100GbE로 70B+ 학습 시 40% 숨겨진 비용 계산기 공개

작성자는 100GbE 환경에서 70B 이상 모델 학습 시 네트워크 대역폭으로 인해 GPU 유휴가 발생해 비용이 최대 40% 증가한다고 지적하며 이를 계산하는 무료 TCO 계산기를 공개했다.

100GbE Ethernet GPU Compute Index

Roboflow Blog Vision AI CompaniesNEW1일 전

RF-DETR 기반 송전선 자동 점검 파이프라인 구축

Roboflow의 RF-DETR 모델과 Transmission Detection 데이터셋을 이용해 송전선의 이물질과 케이블 손상을 자동 탐지하고 PASS/FAIL 판정과 JSON 리포트를 생성하는 검사 파이프라인을 구축한다.

RF-DETR Roboflow

Microsoft Research Blog Benchmarks Vector DBNEW1일 전

Memora: 장기 에이전트 메모리·98% 토큰 절감

Memora는 저장 내용과 검색 방식을 분리해 LoCoMo와 LongMemEval에서 SOTA를 달성하면서 최대 98%의 컨텍스트 토큰 절감을 기록했다.

LoCoMo LongMemEval

AI EngineerNEW1일 전

"스스로 오류를 고치는 AI" Reflection 70B의 자가 교정 원리

Matt Shumer가 모델이 스스로 오류를 감지하고 수정하는 Reflection Tuning 기법과 이를 적용한 Reflection 70B 모델의 개발 과정을 공유한다.

David Ondrej Agents ArchitectureNEW1일 전

단일 LLM의 한계를 넘는 Mixture of Agents 실전 가이드

여러 LLM을 결합하여 성능을 극대화하는 Mixture of Agents 아키텍처의 원리와 Hermes Agent를 활용한 실전 구축 및 배포 과정을 상세히 안내합니다.

Hermes Agent Mixture of Agents

Pinecone Blog Datasets Vector DBNEW1일 전

CC News → Parquet → 로컬 임베딩 → Pinecone 일괄 워크플로

CC News를 Parquet으로 변환한 뒤 로컬에서 임베딩을 생성하고 Pinecone로 일괄 업로드하는 재현 가능한 벡터 테스트셋 구축 워크플로이다.

CC News Parquet

AWS ML Blog Inference ArchitectureNEW1일 전

행 수준 보안 적용 멀티테넌트 LLM 분석 시스템

PAR는 AWS SigV4 서명, Amazon Bedrock 기반 의미 검증, Split-Plane SQL을 결합해 테넌트별 행 수준 접근을 일관되게 보장하는 텍스트→SQL 셀프서비스 분석 에이전트를 운영했다.

Amazon Bedrock Split-Plane SQL

AWS ML Blog Inference Vision AINEW1일 전

Nova 2 Lite와 Claude Sonnet 4.6 기반 연감 자동 매칭 워크플로

두 단계 모델을 결합해 스캔 연감의 사진 경계와 이름 위치를 추출한 뒤 공간 추론으로 3,122개의 이름-얼굴 매칭을 생성하여 93%가 0.95 이상의 신뢰도를 기록했다.

Amazon Bedrock Amazon Nova 2 Lite

r/deeplearningNEW1일 전

SSR 229.2로 보는 선형회귀 계수 최적화

이미지에 담긴 튜토리얼은 잔차 제곱합(SSR)을 계산하고 경사 하강법으로 기울기와 절편을 반복적으로 갱신하여 최적값을 찾는 단계적 절차를 포함한다.

Cursor TrainingNEW1일 전

AI에게 의지가 있을까? 버클리 교수가 말하는 LLM의 실체

Alane Suhr 교수가 LLM의 확률적 본질과 Instruction Tuning 과정을 통해 AI의 주체성이 기계가 아닌 인간에게 있음을 논증한다.

Instruction Tuning RLHF

Cursor Training CompaniesNEW1일 전

AI가 수학 기호를 직접 만든다면? 사고의 한계를 넘는 표기 지능의 혁신

표기법이 인간의 사고 방식에 미치는 영향을 분석하고, 딥러닝을 활용해 논리적 불변성을 유지하는 새로운 시각적 표기 체계를 스스로 학습시키는 실험적 연구를 소개한다.

Deep Learning Thrive Capital

r/LLMDevs Products CompaniesNEW14시간 전

Anthropic·OpenAI 호환 deeperseeker 프로젝트

deeperseeker는 Deepseek를 파싱해 Anthropic과 OpenAI 호환 API 엔드포인트를 제공하며 멀티계정 풀링과 스트리밍/비스트리밍 지원을 포함한다

deeperseeker Deepseek

The AI Grid Architecture HardwareNEW14시간 전

2028년 양자 패권 장악 선언: 트럼프의 행정 명령과 보안 위기

트럼프 대통령이 2028년까지 결함 허용 양자 컴퓨터 구축을 목표로 하는 행정 명령에 서명하며 중국과의 기술 경쟁 및 보안 위협 대응에 나섰다.

Fault-Tolerant Quantum Computing

IBM Technology ArchitectureNEW15시간 전

LLM 추론 속도의 비밀, KV 캐시와 Paged Attention 완벽 정리

LLM 추론의 병목인 메모리 관리를 해결하기 위한 KV 캐시의 원리와 Paged Attention을 통한 GPU 효율화 방법을 다룹니다.

KV Cache Paged Attention

r/neuralnetworksNEW15시간 전

CPU 101%·GPU 51%의 학습 세션 자원 스냅샷

학습 로그와 시스템 통계가 담긴 노트북 스크린샷으로 CPU가 포화 상태이고 GPU 사용률이 낮아 병목 가능성이 보인다.

r/computervision Architecture Vision AINEW15시간 전

단계별 CV 로드맵과 3개 신규 전문 트랙

CV 인턴십 준비를 위한 단계별 학습 체크리스트에 Segmentation·OCR·VLMs 등 3개 전문 트랙을 추가한 GitHub 리포지토리 공유이다.

CNN ViT

r/MachineLearningNEW17시간 전

EACL 2027 CFP의 ARR 논의 분리 및 연장

EACL 2027 CFP가 ARR 절차를 저자응답(9월14–19일)과 심사자 참여(9월20–24일)로 분리하여 논의 기간을 기존 5일에서 늘렸다.

Stackoverflow Architecture CompaniesNEW21시간 전

행동 예측 파운데이션 모델과 초당 수백만 개인화 처리

Yobi는 Transformer와 Graph Neural Network를 결합한 'foundation model of behavior'로 인간 행동을 예측하며 초당 수백만 건의 개인화 결정을 프라이버시를 유지한 채 처리한다고 밝혔다.

Graph Neural Network Transformer

r/LLMDevs Companies Dev ToolsNEW22시간 전

터미널 전용 경량 AI CLI Terminal Pilot

Terminal Pilot은 OpenRouter의 무료 모델을 터미널에서 직접 호출하는 약 300줄 분량의 경량 Python CLI로, 파일 로드·stdin 파이프·시스템 프롬프트 교체를 지원한다.

GitHub OpenRouter

The AI Grid Dev Tools Language ModelsNEW23시간 전

내 컴퓨터에서 무료로 쓰는 코딩 AI, Ornith 9B 로컬 설치 가이드

LM Studio를 활용해 Ornith 9B 모델을 로컬에 설치하고 실전 코딩 및 앱 제작에 활용하는 방법을 단계별로 안내한다.

LM Studio Ornith

メルカリエンジニアリングブログ Coding Agents Dev ToolsNEW1일 전

결제 플랫폼 상주 에이전트 아키텍처와 세션 성능

Merpay는 GCE의 Docker 컨테이너와 copy-on-write 세션, auth-proxy 기반 다층 방어로 결제 도메인용 자율 에이전트 pcp-agent를 운영하고 있다.

Claude Code remote-claude

メルカリエンジニアリングブログ Libraries Coding AgentsNEW1일 전

판단기준을 남기는 AI-Native 개발 실험

메르카리 NFT 팀은 하네스 구성요소는 플랫폼에서 확보하고 각종 판단기준은 팀이 직접 수집·정의하는 전략으로 AI-Native 개발을 진행했다.

Agent SDK Claude Code

Artificial Intelligence CompaniesNEW1일 전

8개월 만에 매출 1,300억 돌파, 산업용 AI 스타트업 Arena AI의 기록적 성장

Arena AI가 8개월 만에 매출 1억 달러를 달성하며 산업용 AI 시장의 폭발적인 수요와 기업 도입 가속화를 증명했다.

Arena AI

Wired AI Products CompaniesNEW1일 전

수백 명 계약직의 어린이 가장을 통한 챗봇 안전성 시험

WIRED는 메타 프로젝트 참여 계약직 수백 명이 어린이로 가장해 Gemini와 ChatGPT에 고위험 주제를 제시하며 반응을 관찰했다고 보도했다.

ChatGPT Gemini

r/LLMDevs Libraries CompaniesNEW1일 전

httpx 패치 기반 Redis 8 시맨틱 캐시, Khazad

httpx 전송 계층을 패치해 대화 임베딩을 Redis 8 벡터셋으로 조회해 LLM API 호출을 시맨틱하게 캐싱하는 Python 도구이다.

httpx OpenAI

Roboflow Blog Vision AI ProductsNEW1일 전

SAM 3로 즉시 객체 탐지와 자동 라벨링 워크플로

텍스트 프롬프트로 SAM 3을 사용해 즉시 객체의 바운딩 박스와 마스크를 얻고 자동 라벨링 후 RF-DETR로 전환해 프로덕션형 모델을 준비한다.

RF-DETR Roboflow Workflows

Roboflow Blog Language Models Vision AINEW1일 전

활주로 FOD 자동 감지 파이프라인과 RF-DETR 적용 사례

Roboflow와 RF-DETR로 활주로 이물질을 감지하고 Gemini 2.5 Pro로 분류·검사 요약을 생성하는 자동화 튜토리얼이다.

Gemini 2.5 Pro RF-DETR

r/computervision Libraries DatasetsNEW1일 전

14,800+ 기능 요소를 담은 SceneFun3D 데이터셋

710개의 레이저 스캔 실내 장면과 14,800개 이상의 기능 요소에 대해 3D 어포던스, 동작 축·유형 및 자연어 작업 설명을 포함한 SceneFun3D 데이터셋이 Hugging Face에 공개되어 FiftyOne으로 비디오와 포인트클라우드를 함께 검토할 수 있다.

FiftyOne SceneFun3D

r/AutoGPT Coding Agents Language ModelsNEW1일 전

Universal Agent OS 거버넌스 툴

AI 코딩 에이전트가 만든 기술부채와 허위 완료 보고를 억제하기 위한 규칙 집합인 Universal Agent OS가 VS Code 확장과 GitHub 저장소로 공개되었다.

Antigravity Claude

Salesforce Engineering Blog Products CompaniesNEW1일 전

Unified Planner로 응답 지연을 2.3초로 단축한 실행 엔진 설계

Unified Planner는 음성·채팅·텍스트 등 모든 Agentforce 상호작용을 단일 런타임으로 통합하여 일부 사례에서 응답 지연을 약 20초에서 2.3초로 줄인 AI 실행·추론 엔진이다.

Agentforce MuleSoft

Roboflow Blog Language Models Vision AINEW1일 전

RF-DETR과 Gemini로 구축한 사출성형 검사 파이프라인

Roboflow RF-DETR을 학습해 사출 성형 부품의 균열·파손·오염을 이미지로 자동 검출하고 Gemini 2.5 Pro로 검사 소견을 생성한다.

Gemini 2.5 Pro RF-DETR

Roboflow Blog Vision AI CompaniesNEW1일 전

RF-DETR과 VLM 결합 2단계 정제 검사 파이프라인

RF-DETR로 정제를 검출하고 VLM으로 결함 유형을 분류해 단일 이미지에서 각 정제의 검사 결과를 반환한다.

RF-DETR Roboflow

Pika Architecture CompaniesNEW1일 전

셀카 한 장으로 경기장 직관 인증샷 6장을 만드는 Pika의 새로운 AI 스킬

Pika MCP에 추가된 Game Day Skill은 사용자 셀카를 기반으로 특정 팀의 경기를 즐기는 모습이 담긴 6장의 이미지 카루셀을 생성한다.

MCP Pika

r/MachineLearning Products CompaniesNEW1일 전

NASA 데이터 기반 농업 시뮬레이터 데모

AgroVision은 NASA 기후 데이터와 머신러닝 예측을 활용해 니카라과 농지별 작황·손실·수익을 시뮬레이션하는 무료 데모이다.

AgroVision ARI

AWS ML Blog Products MLOpsNEW1일 전

AgentCore 관측성으로 에이전트 실패 원인 추적

Bedrock AgentCore의 CloudWatch 기반 관측 스택이 지표·트레이스·구조화된 로그를 결합해 에이전트의 추론 흐름과 툴 호출 오류를 원인 수준에서 규명하게 한다.

Amazon Bedrock AgentCore Amazon CloudWatch

AWS ML Blog ProductsNEW1일 전

Bedrock 기반 CMS-1500 자동 청구 파이프라인

Amazon Bedrock Data Automation과 AgentCore를 결합해 CMS-1500 PDF에서 구조화된 JSON을 추출하고 검증을 거쳐 FHIR 청구 리소스를 생성하는 자동화 파이프라인을 구현했다.

AgentCore Amazon Bedrock Data Automation

Cursor ProductsNEW1일 전

아이폰으로 조종하는 AI 코딩 에이전트, Cursor iOS 앱 출시

Cursor가 iOS 앱을 출시하여 클라우드 에이전트 실행 및 로컬 에이전트 원격 제어 기능을 통한 모바일 코딩 환경을 구축했다.

Cursor

r/LLMDevs Companies ProductsNEW1일 전

1M 토큰 대신 쓰는 Context Warp Drive

Context Warp Drive는 요약 모델 없이 결정적 폴딩과 재생성 시드로 LLM 에이전트의 긴 컨텍스트를 저비용으로 유지하는 오픈소스 엔진이다.

Anthropic Context Warp Drive

LangChain Products LibrariesNEW1일 전

LLM 오케스트레이션의 한계 돌파: 코드 기반 동적 서브에이전트 6가지 패턴

Deep Agents를 통해 코드로 서브에이전트를 동적으로 생성하고 제어하여 복잡한 작업을 안정적으로 수행하는 6가지 핵심 패턴을 다룹니다.

Deep Agents LangChain

Simon Willison Language ModelsNEW1일 전

오픈 소스 코딩 LLM Ornith-1.0, 35B·397B 변형 공개

Ornith-1.0은 DeepReinforce가 공개한 MIT 라이선스 기반의 코딩 특화 LLM으로 Gemma 4와 Qwen 3.5를 기반으로 9B·31B·35B MoE·397B MoE 변형을 제공하며 GGUF 20GB 파일로 로컬 실행이 가능하다.

Gemma 4 Ornith-1.0

Cursor Companies ArchitectureNEW1일 전

롱호라이즌 에이전트의 한계 돌파: KV 캐시를 MLP로 압축하는 기술

Baseten 연구팀이 Sparse Autoencoder를 활용해 KV 캐시를 압축하고 롱호라이즌 에이전트의 메모리 효율을 극대화하는 방법을 제안한다.

Baseten KV Cache

Cursor CompaniesNEW1일 전

비싼 모델이 답이 아니다? Ramp 엔지니어가 밝히는 지능 효율성의 비밀

Ramp의 Ben Geist가 더 많은 연산보다 더 나은 컨텍스트를 통한 엔트로피 감소가 모델 효율성의 핵심임을 설명한다.

Ramp

r/MachineLearning Inference Language ModelsNEW1일 전

Qwen3.6-35B에 적용한 post-hoc Adaptive MoE 게이팅 실험과 PPL 비교

사전 학습된 Qwen3.6-35B 고정-k MoE 모델에 런타임 임계값 기반의 제로-게이팅을 적용한 결과 전문가 수 변동은 가능하지만 대다수 설정에서 PPL 열화가 발생했고 라우터 미세조정이 필요함이 실험적으로 확인되었다.

GGML llama.cpp

r/computervision Libraries Dev ToolsNEW1일 전

20M 폴리곤을 4.3GB로 처리하는 Contrek

스트리밍 스트라이프 병합으로 81,920×81,920 이미지에서 2,027만 개 폴리곤을 추출하고 피크 메모리 4.3GB를 기록했다.

Contrek Docker

AI LABS Companies Language ModelsNEW1일 전

100개 기능 테스트 후 살아남은 Claude Code 실전 워크플로우

실제 프로젝트에서 100개 이상의 기능을 테스트한 결과를 바탕으로 Claude Code의 에이전트 오케스트레이션과 보안 리뷰 및 자동화 워크플로우를 구축하는 최적의 방법을 정리했다.

Anthropic Opus

딥러닝논문읽기모임 Language ModelsNEW1일 전

파인튜닝 없이 3개의 헤드만으로 객체 위치를 찾는 LVLM의 비밀

별도의 학습 없이 LVLM 내부의 특정 어텐션 헤드만을 추출하여 고성능 시각적 접지(Visual Grounding)를 수행하는 방법론을 제시한다.

GPT-4V LLaVA

r/LLMDevs LibrariesNEW1일 전

로컬 루프 탐지 툴 orkaia 공개

도구명과 정규화된 인자를 기반으로 에이전트의 반복 호출 루프를 감지해 N번째 반복에서 중단하고 액션별 토큰 귀속을 제공하는 로컬 패키지 orkaia가 공개되었다.

orkaia

r/artificial CompaniesNEW1일 전

Salesforce의 $2 결과 기반 과금 정의

Salesforce는 4.3백만 문의 데이터를 바탕으로 '해결' 기준을 정해 에이전트 건당 2달러의 결과 기반 과금을 제안했다.

Pega Salesforce