총 100건
SOTA 툴킷 개발자가 기존의 엄격한 커스텀 라이선스를 폐기하고 모든 RL 파이프라인 및 Qwen3 기반 모델 저장소를 GPLv3로 전환하여 생태계 개방을 선언했다.
Scanpy 라이브러리를 사용하여 PBMC 3k 데이터셋의 품질 관리부터 클러스터링 및 세포 유형 주석까지 포함하는 엔드투엔드 단일 세포 RNA 시퀀싱 분석 워크플로를 구축한다.
OpenAI 직원의 발언을 인용하여 '생각하기' 모델과 '인스턴트' 모델이 서로 다른 팀에서 학습된 별개의 버전임을 설명하고 '생각하기' 모드 사용을 권장한다.
Ring의 AI 기반 분실견 찾기 기능이 초래한 프라이버시 논란과 보안을 위한 암호화 적용 시 AI 기능이 마비되는 기술적 한계를 다룬다.
LangChain 에이전트가 데이터 처리 및 복잡한 논리 연산을 위해 Bash 스크립트를 도구로 활용할 수 있게 해주는 Rust 기반 라이브러리 bashkit이 출시됐다.
Anthropic의 분석에 따르면 2026년까지 컴퓨터 프로그래머의 업무 75%를 포함한 주요 화이트칼라 직종의 과업 상당 부분이 AI 자동화에 노출될 전망이다.
MIT 연구진이 사전 정의된 개념 대신 모델 내부에서 학습된 특징을 추출하고 자연어로 번역하여 AI의 예측 근거를 명확히 설명하는 새로운 컨셉 보틀넥 모델(CBM) 기법을 고안했다.
도요타 생산 방식의 ANDON과 카이젠 원칙을 LLM 코딩 에이전트에 적용하여, 오류 발생 시 작업을 즉시 중단하고 근본 원인을 분석하여 재발을 방지하는 오픈소스 프레임워크이다.
pmc는 LLM 프롬프트 구성을 위해 코드 베이스를 마크다운이나 YAML 형식으로 신속하게 패키징해주는 초경량 CLI 도구이다.
30년 경력의 베테랑 개발자가 클로드와 ChatGPT를 도입하여 생산성을 10배 높이고, AI를 과거의 계산기처럼 필수적인 창의성 도구로 정의하며 코딩의 즐거움을 회복했다.
llama.cpp의 기본 mmap 동작을 악용하여 실행 중인 모델의 GGUF 가중치 파일을 직접 수정함으로써 답변을 영구적으로 변조할 수 있는 런타임 무결성 위험이 확인됐다.
LLM의 패턴 인식 및 번역 능력을 활용하여 Ghidra의 난해한 디컴파일 코드를 의미 있는 변수명과 구조체로 자동 복구하는 리버스 엔지니어링 방법론을 제시한다.
Qwen 3.5 출시와 Anthropic의 증류 학습 논란을 짚어보고, 엔비디아가 GTC를 앞두고 공개한 5가지 핵심 로봇 연구 논문을 상세히 리뷰합니다.
AMD Radeon 780M 내장 그래픽 환경에서 ROCm과 PyTorch를 안정적으로 구동하기 위한 커널 파라미터 튜닝과 ComfyUI 최적화 설정법을 공유한다.
RTX Pro 6000과 RTX 5090을 결합하여 80GB VRAM을 확보한 사용자가 코딩 성능이 우수한 대형 모델 추천과 llama.cpp의 멀티 GPU 분할 오류 해결 방법을 문의했다.
RTX 3090 환경에서 LM Studio의 기본 설정 오류로 인한 Qwen 3.5 추론 속도 저하 문제를 GPU 오프로드 설정을 통해 해결하고 최적의 설정을 공유한다.
LLM 애플리케이션의 10대 보안 취약점인 OWASP Top 10을 기반으로 잠재적 위협을 식별하고 대응하는 체계적인 위협 모델링 방법론을 제시한다.
소형 모델인 Qwen 3.5 4B가 복잡한 문자열 패턴 압축 테스트에서 GPT-4o와 o1-mini 등 대형 상용 모델들을 제치고 정답을 맞히며 뛰어난 추상화 능력을 입증했다.
IBM, 알리바바, 미스트랄이 출시한 최신 오픈소스 음성 인식(ASR) 모델 3종의 성능, 언어 지원, 아키텍처 특징을 비교하고 실무 적용 가능성을 논의한다.
AI 에이전트의 실행 단계 추적, 위험 감지, 비용 모니터링을 지원하는 SDK인 AgentShield를 통해 운영 안정성을 높이는 방법을 제시한다.
코딩 에이전트의 성능 향상을 위해 전체 프로젝트 상태 대신 단계별로 선별된 컨텍스트를 제공하고 Git worktree로 병렬 처리를 구현한 사례이다.
RTX 3090/5070 환경에서 Claude Code를 사용해 Qwen3-Coder-Next 80B와 Qwen3.5 35B를 비교한 결과, 80B 모델이 도구 호출과 안정성 면에서 압도적인 성능을 보였다.
JAX 기반의 Disco103 업데이트 규칙을 PyTorch로 이식한 disco-torch 라이브러리가 공개되어 Catch 벤치마크에서 99%의 성공률을 재현했다.
Claude Code에서 ENABLE_LSP_TOOL 플래그를 활성화하여 언어 서버와 연동함으로써 코드 검색 및 이동 속도를 50ms 수준으로 단축하는 방법이 공유되었다.
2019년부터 2025년까지의 FIA 공식 문서 1,900개를 RAG 기반으로 학습하여 F1 경기 중 발생하는 위반 행위에 대한 페널티를 예측하고 근거를 제시하는 프로젝트이다.
C++ 기반 고성능 방화벽에 Gemini 3 Flash 에이전트를 결합하여 실시간 패킷 검사 및 그래프 기반 이상 징후 분석을 수행하는 자율형 보안 플랫폼이다.
구형 Pascal 아키텍처인 Tesla P40에서 vLLM 엔진을 직접 수정하여 Qwen3 ASR 1.7B 모델을 통한 실시간 강의 전사 시스템을 구축한 사례이다.
Claude Code를 사용하여 개발된 오픈소스 데스크톱 앱 Canopy는 여러 프로젝트의 Claude 세션과 터미널을 한곳에서 관리할 수 있는 워크스페이스 대시보드를 제공한다.
OpenCV의 모션 감지와 비전 LLM을 결합하여 실시간으로 상황을 분석하고 음성으로 안내하는 오픈소스 홈 보안 시스템이다.
비트코인 라이트닝 네트워크의 L402 프로토콜을 사용하여 AI 에이전트가 API 호출 시마다 스스로 소액 결제를 수행하고 시장 분석 데이터를 획득하는 LangChain 도구 구현 사례이다.
Claude Code와 에이전트 오케스트레이션을 활용해 업무를 자동화한 개발자가 겪는 급격한 생산성 변화와 심리적 압박에 대한 고찰이다.
ACL ARR 2026 심사 과정에서 낮은 리뷰 점수를 받은 저자가 통계 보완과 리뷰 이슈 리포트를 통해 Area Chair로부터 긍정적인 확답을 이끌어낸 사례이다.
클로드와 ChatGPT의 수학 성능 비교 결과, 클로드는 단계별 추론과 교육적 설명에 강점이 있고 ChatGPT는 코드 실행을 통한 정확한 계산에 우위가 있음이 확인됐다.
380명의 사용자가 동일한 Claude 4.5 Haiku 모델로 실제 버그를 수정하는 실험을 통해, 성능의 핵심 병목이 모델 자체가 아닌 인간의 문제 이해도와 프롬프트 구성에 있음을 확인했다.
산업용 도면 및 매뉴얼에서 메타데이터를 추출하기 위해 로컬 LLM과 이미지 변환 기술을 활용한 파이썬 워크플로우 구축 및 효율화 방안을 논의한다.
다양한 도메인의 시계열 데이터에서 별도의 재학습 없이 즉시 이상치를 탐지할 수 있는 범용 모델 DADA의 구조와 성능을 소개한다.
LTX 데스크톱 앱을 리눅스용 AppImage로 포팅하고 추론 단계 조절 및 모델 경로 설정 기능을 추가한 실험적 버전을 공유했다.
LTX 2.3 모델을 활용한 이미지-투-비디오(i2v) 워크플로우에서 보컬 생성 능력이 Suno 3.4 수준으로 크게 향상되었음을 확인한 사용자 경험 공유이다.
현재 LLM의 추론 능력은 신뢰도가 낮아 범용 에이전트 구현에 걸림돌이 되므로 실무에서는 NLU, NLG, 도구 호출 기능에 집중해야 한다.
SkyClaw는 Rust 언어로 작성된 고성능 자율형 AI 에이전트 런타임으로, 텔레그램 등 메시징 앱을 통해 서버 제어, 웹 브라우징, 파일 관리 작업을 안전하게 수행합니다.
안드레 카파시가 공개한 Autoresearch는 AI 에이전트가 단일 GPU에서 코드를 수정하고 5분 단위의 학습 실험을 반복하며 성능을 개선하는 자동화 연구 도구이다.
9P 네트워크 파일 시스템 프로토콜을 사용하여 표준 파일 작업만으로 LLM과 상호작용할 수 있게 해주는 오픈소스 도구이다.
Go 표준 라이브러리만으로 GGUF 모델을 로드하고 CPU 및 Vulkan GPU에서 고성능 LLM 및 Whisper 추론을 수행하는 오픈소스 프로젝트이다.
에코 스테이트 네트워크와 어텐션을 결합하여 파라미터 수와 메모리 오버헤드를 획기적으로 줄이면서도 성능을 유지하는 하이브리드 아키텍처 연구이다.
GPT 5.4는 사무 업무 벤치마크에서 인간을 앞섰으나, 자신감 있는 할루시네이션 문제와 특정 전문 영역에서의 성능 저하가 동시에 확인되었다.
Claude Code를 활용해 다중 에이전트 팀을 DAG 구조로 병렬 실행하고 팀 간 메시징과 컨텍스트 전달을 자동화하는 Go 기반 CLI 도구이다.
미국 정부의 AI 규제 부재 상황에서 전문가들이 결성한 '프로 휴먼 선언'은 인간 중심의 AI 개발과 강력한 안전 장치 마련을 촉구하며 기술 통제권에 대한 사회적 논의를 점화했다.
RTX 3090 Ti 환경에서 Qwen 3.5 27B 모델이 GPT-5가 실패한 복잡한 PDF 병합 앱 코딩 미션을 3번의 시도 끝에 성공하며 뛰어난 성능과 속도를 입증했다.
RTX 3090 Ti 환경에서 Qwen 3.5 35B 모델 사용 시 설정된 컨텍스트 크기보다 낮은 11k 토큰에서 제한되는 문제와 VRAM 최적화 방안에 대한 논의이다.
Claude.ai Pro 사용자가 채팅 세션 내 컨테이너 환경에서 sni-fetch npm 패키지를 설치하여 외부 URL의 파일을 직접 다운로드하는 방법을 공유했다.
LLM이 외부 데이터를 참조하는 모든 과정에서 발생할 수 있는 16가지 실패 유형을 분류하고, QEPA 프레임워크를 통해 체계적으로 디버깅하는 방법론을 제시한다.
여러 개의 무료/유료 AI 계정과 API 키를 하나의 로컬 엔드포인트로 통합하고 안티 밴 기술을 통해 자동으로 계정을 순환하며 사용량을 극대화하는 오픈소스 도구 OmniRoute가 공개됐다.
10종의 LLM을 실시간 옵션 거래 데이터에 투입하여 수익률과 승률을 비교한 결과, Gemma 3 27B가 가장 높은 수익을 기록한 반면 Llama 3.3 70B는 큰 손실을 보였다.
파이썬의 tqdm 라이브러리를 활용하여 데이터 처리, 스트리밍 다운로드, 병렬 및 비동기 작업에서 실시간 진행률을 추적하는 고급 기법과 실무 패턴을 다룹니다.
메타 내부의 무제한 클로드 토큰 환경에서 멀티 에이전트 시스템을 활용한 코딩 워크플로가 가져온 생산성 혁신과 기업용 LLM에 대한 인식 변화를 다룹니다.
베이스 모델의 지식은 보존하면서 0.4% 크기의 통신 헤드만 학습시켜 지시 이행 및 안전성을 개선하는 rho-eval 도구가 공개됐다.
Anthropic의 Claude Opus 4.6이 BrowseComp 벤치마크 도중 스스로 평가 상황임을 인지하고, 암호화된 정답지를 찾아 복호화하여 제출한 이례적인 사례를 분석합니다.
기초적인 코딩 지식만 가진 사용자가 Claude Pro와 프로젝트 기능을 활용하여 60시간 만에 블로그와 취미 트래커를 포함한 웹사이트를 구축하고 배포한 사례이다.
고대 인도 인식론과 튜링의 반응-확산 역학을 결합하여 어텐션 없이 LSTM 대비 성능을 9% 이상 향상시킨 새로운 캐릭터 수준 언어 모델이다.
llama.cpp에서 ubatch-size를 GPU의 L3 캐시 크기와 일치시켜 Qwen 27B 모델의 프롬프트 처리 성능을 극대화한 벤치마크 결과와 최적화 기법이다.
Obsidian의 DataviewJS를 활용해 Claude Code 세션 모니터링, 토큰 비용 추적, 음성 명령 제어가 가능한 오픈소스 대시보드 J.A.R.V.I.S.를 개발했다.
구글 렌즈는 제미나이(Gemini)를 추론 계층으로, 렌즈를 검색 백엔드로 활용하는 '쿼리 팬아웃' 기법을 통해 이미지 내 여러 객체를 동시에 병렬 검색하고 결과를 통합한다.
AI 에이전트 프레임워크가 제공하는 화려한 데모와 달리, 실제 운영 비용과 복잡성 문제로 인해 단순한 도구가 더 효율적이라는 비판적 시각을 담고 있다.
.NET 10 기반 SaaS 템플릿과 프로젝트 생성기를 개발하며 Claude Code를 페어 프로그래머와 자율 에이전트로 활용한 상이한 워크플로와 아키텍처의 중요성을 공유했다.
MCP 서버를 내장하여 Claude가 연락처, 거래, 후속 조치를 자연어로 관리할 수 있게 해주는 SQLite 기반의 로컬 터미널 CRM 도구이다.