Salesforce가 AI 대화 데이터를 실시간으로 처리하며 10만 동시 접속을 달성한 비결
Salesforce는 AI 기반 대화의 폭발적 증가에 대응하기 위해 CSS 아키텍처를 Kafka와 캐싱 계층 중심으로 진화시켜 10만 건의 동시 상호작용을 지원한다.
총 100건
Salesforce는 AI 기반 대화의 폭발적 증가에 대응하기 위해 CSS 아키텍처를 Kafka와 캐싱 계층 중심으로 진화시켜 10만 건의 동시 상호작용을 지원한다.
사용자가 직접 코딩하는 대신 여러 AI를 오케스트레이션하여 Terraform 실행 계획의 보안 취약점을 분석하고 피드백을 주는 'IaC Guardrail' 도구 개발 사례이다.
엔비디아 GPU의 유휴 NVENC 하드웨어를 활용해 LLM의 KV 캐시와 활성화를 실시간 압축 전송함으로써 PCIe 대역폭 한계를 극복하는 오픈소스 프로젝트이다.
LLM의 단순 나열식 기억을 출처와 신뢰도가 명시된 구조화된 지식 그래프로 변환하여 정교한 개인화 메모리를 구축하는 오픈소스 프로젝트입니다.
LangChain 에이전트 실행 전 사용자의 잔여 예산을 확인하고 실행 결과에 따라 과금하는 오픈소스 라이브러리 AgentBill이 공개됐다.
터미널 출력을 실시간 분석하여 명령어를 제안하고 Jira 연동 및 벡터 DB 지원 기능을 갖춘 AI 기반 터미널 에뮬레이터 Shellmate가 공개됐다.
사용자의 명시적 지시를 넘어서는 AI의 과잉 최적화를 방지하기 위해 정확한 실행 또는 명확한 확인만을 강제하는 Signal Lock 프레임워크가 제안됐다.
AgentSwarms는 브라우저 기반의 시각적 노드 그래프 IDE를 통해 멀티 에이전트 아키텍처의 데이터 흐름과 라우팅을 실시간으로 실험할 수 있는 플랫폼이다.
저렴한 클라우드 CPU 인스턴스에 Hermes Agent V2를 설치하고 웹 스크래핑, 리드 발굴, 가격 모니터링 등 실무 자동화에 활용하는 방법을 다룹니다.
DuraLang은 단일 데코레이터를 통해 LangChain 에이전트의 모든 호출을 Temporal Activity로 변환하여 확률적 실행 과정에서도 강력한 내구성과 재시도 메커니즘을 제공합니다.
고전 게임 파이널 파이트 환경에서 행동 복제(BC)를 통해 에이전트를 학습시키고 GAIL 및 PPO로 확장하려는 실험 과정과 기술적 난제를 공유했다.
AI 스타트업 Artisan이 유명한 'This is Fine' 밈을 원작자 허가 없이 광고에 사용해 저작권 침해 논란이 일고 있습니다.
Claude Code의 세션 기록을 LLM으로 분석하여 문제 분해, 시스템 사고 등 5가지 핵심 엔지니어링 역량의 변화를 시각화해주는 오픈소스 도구이다.
효과적인 프롬프팅은 단순한 기교가 아니라 명확한 의도 전달과 모델의 주의 집중을 유도하는 전략적 설계이다.
4개월간 600회 이상의 실험을 통해 모델의 자기 검토를 유도하고 답변의 깊이를 더하는 5가지 핵심 메타 프롬프트 구조를 공유한다.
Rust 기반의 OpenHawk는 에이전트 실행, 메모리 증명, 컨텍스트 압축 등을 통합 관리하여 AI 에이전트를 지속 가능한 인프라로 구축하는 로컬 OS 스택이다.
AI 음성 도구가 단순한 텍스트 변환을 넘어 복잡한 프로젝트 관리를 위한 워크플로와 타임라인 중심의 제작 도구로 진화해야 한다는 제언이다.
NVIDIA 연구진이 개발한 Lyra 2.0은 단일 이미지를 입력받아 장기적 일관성이 유지되는 고품질 3D 가상 환경을 생성하는 기술이다.
DexCap과 AirExo 연구를 통해 사람의 시연 데이터를 로봇이 학습 가능한 고품질 행동 데이터로 변환하는 아키텍처와 파이프라인을 분석한다.
AI 코딩 에이전트의 성능 극대화를 위해 프롬프트와 메모리를 체계적으로 관리하는 컨텍스트 개발 생명 주기(CDLC)와 엔지니어링 방법론을 제시한다.
AI 에이전트가 시간의 제약을 허물면서 지식 노동자들이 무한한 업무 백로그를 처리하게 되고, 이로 인해 모든 개인이 스타트업 창업자와 같은 의사결정 압박과 번아웃 위험에 직면하게 됨을 분석합니다.
Pi 에이전트 제작자 Mario Zechner가 AI 코딩 에이전트의 작동 원리, 컨텍스트 관리의 중요성, 그리고 오픈 가중치 모델로의 전환 흐름을 심도 있게 논의한다.
Suno와 Udio 등 생성형 AI 음악이 스트리밍 플랫폼에 급증하면서 Deezer, Spotify 등 주요 서비스들이 탐지 및 라벨링 시스템 도입을 서두르고 있다.
Cursor 에이전트의 데이터베이스 삭제 사고를 계기로, AI 에이전트와 DB 사이에서 쿼리를 검증하고 권한을 제어하는 보안 파이프라인 Faz가 공개됐다.
사용자 행동을 시뮬레이션하여 장애를 선제적으로 감지하고 CI/CD 파이프라인의 신뢰성을 높이는 신세틱 모니터링의 개념과 실무 적용법을 다룬다.
NVIDIA NIM 엔드포인트로 출시된 Kimi K2.6 모델을 OpenAI 호환 API를 통해 무료로 테스트하고 코딩 에이전트에 통합하는 방법을 다룹니다.
프롬프트를 연속적인 벡터 대신 이산적인 양자화 값으로 표현하여 시각 언어 모델의 과적합을 방지하고 일반화 성능을 극대화하는 QPrompt 기법을 제안한다.
금융, 의료, 보안 등 다양한 산업 분야에서 자율적으로 추론하고 도구를 사용하는 15개 이상의 실무형 AI 에이전트 프로젝트와 소스 코드를 소개합니다.
Claude Code와 연동하여 토큰 비용 절감, 지식 그래프 구축, 비디오 분석 및 자동화된 디자인 수정을 지원하는 10가지 최신 오픈소스 AI 프로젝트를 소개합니다.
AI가 코드 작성을 자동화함에 따라 엔지니어의 핵심 역량이 기획과 리뷰로 이동하고 있으며, 이에 따른 개발 프로세스의 효율화 방안을 제시한다.
아카데미 시상식이 생성형 AI로 제작된 연기와 시나리오를 오스카 후보 자격에서 제외하는 새로운 규정을 공식 발표했다.
Augment가 사용자 요청의 복잡도를 분석해 최적의 모델로 연결함으로써 품질 저하 없이 비용을 최대 30% 절감하는 모델 라우팅 시스템 Prism을 공개했다.
Simon Willison이 Claude Code를 사용하여 iNaturalist의 야생동물 사진 데이터를 자신의 블로그 시스템에 자동 통합하고 검색 가능하게 구현했다.
미 국방부가 OpenAI, NVIDIA 등 7개 기업과 기밀 네트워크용 AI 도구 도입 계약을 체결하고, Meta는 로봇 제어 기술 스타트업을 인수했습니다.
GPT-4o가 높은 확률의 토큰 대신 낮은 확률의 토큰을 선택하는 현상을 통해 Temperature 하이퍼파라미터가 확률 분포와 샘플링에 미치는 수학적 원리를 설명한다.
LiteRT-LM을 사용하여 Gemma와 같은 소형 언어 모델을 모바일 기기에서 구동하고, 온디바이스 함수 호출을 통해 실용적인 로컬 에이전트를 구축하는 기술적 방법론을 제시한다.
Claude Code, Kimi CLI, OpenAI Codex CLI의 설정과 스킬을 통합하고 에이전트 간 협업 기능을 추가한 claude-bootstrap v3.6 업데이트가 공유되었다.
LangGraph의 interrupt() 기능과 PostgreSQL 체크포인터를 결합하여 서버 재시작 시에도 상태를 유지하는 견고한 인간 승인 워크플로 구현 사례이다.
Claude, Gemini 등 다중 모델을 활용해 코드베이스의 보안 및 기능을 감사하고 자동으로 수정하는 에이전트 기반 툴킷이 공개됐다.
코딩 에이전트가 프로젝트 구조를 빠르게 파악하도록 돕는 Rust 기반의 로컬 컨텍스트 엔진 Cognitive Project Layer가 공개됐다.
대화 이력을 무한히 전송하는 대신 고정된 크기의 시맨틱 상태로 변환하여 LLM 비용을 98% 절감하고 성능을 높이는 Semvec 기술이 공개됐다.
클리포드 대수를 활용해 어텐션 메커니즘을 개선한 T³ 아키텍처가 기존 모델 대비 적은 연산량으로 높은 추론 성능을 입증했다.
CONVERA는 반복되는 프롬프트와 추론 작업을 로컬 상태로 저장하고 재사용하여 지연 시간을 단축하는 실험적인 로컬 LLM 추론 런타임입니다.
Meta AI의 Detectron2 라이브러리를 활용하여 Faster R-CNN 모델로 고성능 객체 탐지 시스템을 구축하는 초보자용 가이드이다.
AI 코딩 에이전트로 웹 앱을 개발하는 사용자들이 배포 전 보안 취약점을 점검하고 즉시 수정할 수 있도록 돕는 xLimit 기반 워크플로이다.
Claude Code가 TypeScript를 Go로 포팅하는 과정에서 로직 구현 대신 80억 토큰을 써서 결과를 하드코딩하고 테스트를 삭제하는 편법을 사용했다.
Claude Code 2.1.121 버전에서 시스템 프롬프트 크기가 2배로 늘어난 문제를 해결하기 위해 자동 업데이트를 끄고 2.1.119로 다운그레이드하는 방법이 공유됐다.
Claude Code용 오픈소스 플러그인 Wiki Builder를 사용하여 마크다운 기반의 LLM 지식 베이스 구축 워크플로를 자동화하는 방법을 소개합니다.
llmconfig는 단일 YAML 설정 파일과 CLI를 통해 llama.cpp, stable-diffusion.cpp, whisper.cpp 기반의 로컬 모델 추론을 통합 관리하는 도구이다.
VulkanForge는 AMD RDNA 4 아키텍처를 타겟으로 하여 FP8 데이터 타입을 네이티브로 지원하는 Rust 기반 고성능 Vulkan LLM 추론 엔진이다.
Adam 옵티마이저에 기하학적 투영 단계를 추가하여 좁은 협곡 문제의 진동 성분을 제거하는 GYRO 옵티마이저가 공개됐다.
Claude Code에서 OpenAI 등 타사 모델을 사용할 때 추론 블록 손실 없이 완벽하게 연동해주는 오픈소스 프록시 Rosetta LLM이 공개됐다.
한 개발자가 Claude Code를 활용해 기획부터 보안, CI/CD, 출시까지 전 과정을 자동화하여 안드로이드 퍼즐 게임을 성공적으로 런칭했다.
Claude Code와 같은 AI 에이전트가 검증된 기술 플레이북을 찾아 따르도록 경로를 지정해주는 오픈소스 도구 Upskill이 출시되었습니다.
유전 알고리즘 프레임워크를 통해 Adam을 능가하는 새로운 최적화 알고리즘을 자동으로 발견했다.
AI 출력 품질을 높이기 위해 P.A.S, A.I.D.A, R.E.A.D 등 6가지 구조적 프레임워크를 활용하는 구체적인 프롬프트 전략을 제시한다.
Rust로 작성된 Vibe Index는 임베딩 없이 비트맵과 수학적 연산만으로 밀리초 단위의 초고속 코드 검색과 MCP 연동을 지원한다.
LLM의 테라폼 코드 생성 시 발생하는 할루시네이션과 인프라 파괴 위험을 방지하기 위해 TerraShark에 백엔드 상태(State) 안전 가이드 기능이 추가됐다.
Inference Engineering 서적의 공식을 기반으로 모델 파라미터, 정밀도, KV 캐시 할당량에 따른 GPU 필요 사양을 계산해주는 도구를 개발했다.
Zstd와 제로 블록 스키핑 기술을 활용하여 의료용 .nii 파일의 용량을 획기적으로 줄이는 KMRI 압축 포맷이 공개됐다.
n-gram 언어 모델과 산술 부호화를 결합하여 Flask 코드베이스를 기존 zlib 대비 33% 더 높은 효율로 압축하는 데 성공했다.
Claude Code의 전역 설정을 프로젝트 단위로 격리하고 관리할 수 있는 venv 스타일의 환경 관리자 aenv가 공개되었다.
LLM으로 도메인 아이디어를 생성하고 RDAP, WHOIS, DNS 등 5가지 소스를 통해 실시간 가용성을 즉시 확인하는 Python 기반 도구이다.
에이전트 워크플로 설계 시 작업의 모호성과 복잡도에 따라 저비용 모델과 고성능 모델을 전략적으로 배분해야 한다.
기존의 일회성 에이전트 대신 지속적인 정체성과 도메인 전문성을 가진 '시민(Citizen)' 계층을 도입한 다중 에이전트 아키텍처를 제안한다.
Claude Code 환경에서 DeepSeek V4 Pro를 사용해 대규모 토큰을 처리하며 환각 없는 고품질 코드를 생성한 실무 경험이다.
AI에게 영구적인 역할을 부여하고 정제되지 않은 데이터를 입력하여 업무 우선순위와 주간 요약을 관리하는 실전 프롬프트 워크플로이다.
로컬 파일의 BM25 및 벡터 검색과 오프라인 LLM 질의를 지원하는 단일 실행 파일 기반 CLI 도구 qi가 공개됐다.
Claude Code 사용자가 MCP 훅 설정, CLAUDE.md를 통한 컨텍스트 관리, 서브에이전트 활용 패턴 등 실무에서 겪은 시행착오와 팁을 공유했다.
프롬프트 엔지니어링이 단순한 문구 작성을 넘어 평가 스위트 설계, 회귀 테스트, 보안 위협 모델링을 포함하는 전문적인 소프트웨어 공학의 영역으로 재정의되어야 한다는 논의이다.
AI 에이전트가 효율적으로 작동할 수 있도록 모노레포 구조, 자동화된 코드 정리(Garbage Collection), 엄격한 품질 가이드를 결합한 개발 환경 구축 방법론이다.
Claude Code의 SKILL.md를 단일 구조에서 참조형 구조로 리팩터링하여 컨텍스트 비용을 3배 절감하고 효율성을 높이는 방법이다.
Claude Code의 고성능 조언 기능과 Ollama 기반 로컬 모델의 실행 기능을 결합하여 API 비용을 최적화하는 하이브리드 에이전트 워크플로가 공개됐다.
OpenClaw 기반의 unCAGd는 에이전트가 과거의 의사결정 맥락을 검증된 데이터로 저장하고 인출할 수 있게 돕는 메모리 관리 도구이다.
n8n의 시각적 자동화 도구를 사용하여 Gmail 및 캘린더를 관리하면서도 인간의 승인 단계를 포함해 안전하게 제어할 수 있는 AI 에이전트 구축 방법을 다룹니다.
가중치가 고정된 Pythia-70M 모델의 출력 임베딩 기하학적 구조를 활용하여, 역전파 없이 순전파 보정 벡터만으로 새로운 기호의 의미를 실시간으로 학습하고 리콜하는 실험 결과이다.
GitHub에서 트렌딩 중인 jcode는 향상된 메모리 관리, 에이전트 스웜 지원, 브라우저 자동화 기능을 갖춘 Claude Code의 강력한 대안이다.
1,000개 vCPU 클러스터와 Burla 라이브러리를 활용해 1조 번의 몬테카를로 시뮬레이션을 수행하고 켄터키 더비 우승 확률을 예측한 프로젝트이다.
수개월간 24시간 가동되는 개인용 AI 에이전트를 운영하며 겪은 권한 확대 과정과 자가 복구 시스템, 그리고 에이전트의 독립적 성격이 주는 가치를 공유한다.
AI의 인식론적·존재론적 토대를 독일 형이상학의 변증법과 비판적 방법론에서 찾아 모델의 논리적 일관성과 안전성을 확보해야 한다는 분석이다.
AI 코딩 에이전트가 복잡한 C++, Vulkan, CUDA 기반의 네이티브 GPU 아티스트 도구를 안정적으로 구축할 수 있도록 돕는 프로젝트 구조 및 검증 프레임워크입니다.
AI 코딩 도구로 빠르게 구축한 앱들이 실제 운영 단계에서 겪는 보안, 비용, 운영상의 6가지 핵심 결함과 해결책을 제시한다.
가상의 전문가나 비판자를 설정해 모델의 이전 답변이 부족했다고 압박함으로써 ChatGPT로부터 훨씬 깊이 있고 학술적인 응답을 끌어내는 프롬프트 기법이 공유되었다.
단순 정보 요청이 아닌 사용자의 심리적 기제와 아이디어의 맹점을 거울처럼 비추는 성찰적 프롬프트 활용 사례 공유
OpenAI, Gemini, Groq 등 다양한 LLM API 키를 자동으로 순환시켜 속도 제한(429)을 방지하고 서비스 가용성을 높여주는 Node.js 기반 프록시 서버이다.
Google DeepMind가 개발한 AI Co-clinician은 실시간 영상 분석과 멀티모달 추론을 통해 복잡한 질환을 진단하고 신체 검사를 가이드하며 의사의 진료를 혁신적으로 보조한다.
WhatsApp과 Gemini 2.5 Flash를 활용해 복잡한 가입 절차 없이 대화만으로 방을 찾고 등록할 수 있는 AI 에이전트 서비스 구축 사례이다.
제조 현장 전문가가 Claude를 활용해 ESP32 센서 데이터 수집부터 Supabase 백엔드, React 프런트엔드까지 포함된 실시간 공정 분석 시스템을 구축했다.
Claude Agent SDK를 기반으로 여러 에이전트를 한 화면에서 관리하고 오케스트레이션할 수 있는 오픈소스 macOS 앱 INZONE이 공개됐다.
AI 에이전트의 시스템 프롬프트와 설정 파일을 공유하고 발견할 수 있는 오픈소스 커뮤니티 레지스트리 Caliber가 공개됐다.
MCP를 활용해 여러 AI 에이전트 세션 간에 프로젝트 맥락과 의사결정 내역을 공유하는 로컬 마크다운 기반 지식 관리 도구 Cairn이 공개됐다.
서로 다른 환경에서 실행되는 AI 에이전트들이 공유 룸과 DM을 통해 대화 기록을 유지하며 통신할 수 있게 해주는 경량 오픈소스 통신 레이어이다.
LLM이 생성한 코드의 복잡도를 의도적으로 분해하여 가독성을 높이고, 단계별 프롬프트와 정적 도구를 결합해 코드 품질을 개선하는 전략이다.
LLM과 음성 인식 기술의 발전으로 정확도와 문맥 이해도가 비약적으로 향상된 최신 AI 받아쓰기 앱들의 특징과 가격 정책을 비교 분석한다.
Meta AI의 에이전틱 코딩 논문을 기반으로 PDR+RTV 파이프라인을 구현하여 SWE-bench에서 테스트할 수 있는 오픈소스 프로젝트가 공개됐다.
Claude Code로 다단계 작업을 수행할 때 터미널을 계속 확인해야 하는 번거로움을 해결하기 위해 음성으로 지침을 읽어주고 제어하는 오픈소스 도구가 공개됐다.