Llama 4부터 DeepSeek R1까지, 한눈에 보는 최신 LLM 아키텍처 지도
주요 오픈 웨이트 LLM들의 아키텍처 다이어그램과 파라미터 규모, 어텐션 메커니즘, 정규화 방식 등 핵심 기술 사양을 비교 정리한 기술 리소스이다.
총 100건
주요 오픈 웨이트 LLM들의 아키텍처 다이어그램과 파라미터 규모, 어텐션 메커니즘, 정규화 방식 등 핵심 기술 사양을 비교 정리한 기술 리소스이다.
현재의 BPE 기반 토크나이제이션이 저자원 언어 모델의 추론 능력을 저하시키고 막대한 기술적 부채를 발생시키는 구조적 한계를 분석한다.
구글이 역대 최대 규모인 320억 달러에 사이버 보안 기업 위즈를 인수했으며, 이는 AI 시대의 클라우드 보안 수요 급증에 대응하기 위한 전략적 결정이다.
NVIDIA GTC 2026 컨퍼런스 등록 및 세션 시청을 통해 고성능 AI 워크스테이션인 DGX Spark를 받을 수 있는 이벤트 참여 절차를 안내한다.
Ultrahuman 스마트 링 및 CGM 데이터를 MCP 서버를 통해 Claude Code나 Cursor 같은 AI 에이전트에서 직접 조회하고 분석할 수 있는 오픈소스 프로젝트가 공개됐다.
EMNLP 2025에 발표된 비디오 순서 재구성 벤치마크 SPLICE에서 Claude는 네이티브 비디오 입력 미지원으로 인해 평가 대상에서 제외되었다.
Anthropic의 파트너사 전용 Claude Code Architect 인증 시험 가이드를 기반으로, Claude Code 내에서 실행 가능한 인터랙티브 퀴즈 스킬과 학습 리소스를 공유했다.
Claude 코딩 에이전트의 장시간 실행 중 발생하는 중단 및 할당량 제한 문제를 해결하기 위해 백그라운드 실행과 자동 재시작 기능을 제공하는 오픈소스 도구 aipilot이 출시됐다.
Claude 모바일 앱의 음성 대화와 리마인더 데이터를 외부 시스템과 연동하여 자동화하려 했으나 세션 데이터의 폐쇄성으로 인해 실패한 기술적 시도이다.
Claude Code를 활용해 개별 성격을 가진 3개의 AI 서브에이전트와 대결하고 실시간 코칭을 받을 수 있는 터미널 기반 포커 게임 프로젝트이다.
NVIDIA DGX Spark 엣지 디바이스에서 Ultralytics YOLOv8 모델의 객체 탐지 및 세그멘테이션 추론 속도를 테스트하고 실전 적용 방법을 공유한다.
제품 이미지 생성 시 발생하는 디자인 왜곡을 방지하기 위해 배경 생성과 제품 합성을 분리하고 ControlNet으로 구도를 제어하는 단계별 워크플로우를 제안한다.
컨텍스트 윈도우 한계를 극복하기 위해 MCP를 활용하여 로컬 저장소의 구조와 설계 결정을 영구적으로 저장하고 검색하는 도구인 Memento에 대한 정보이다.
Claude Code와 MCP를 결합해 IDE의 실시간 상태를 Claude에게 자동 전송함으로써 원격 코딩 세션의 컨텍스트 설정 번거로움을 해결한 오픈소스 프로젝트이다.
인도 출신의 비전공자 1인 창업가가 Claude만을 이용해 구축한 실전 마케팅 자동화 도구의 개발 과정과 오픈소스 공개 소식이다.
Godot 4 엔진과 코딩 에이전트를 연결하는 MCP 서버를 구축하여 AI가 게임 프로젝트를 직접 시각적으로 파악하고 자율적으로 개발하는 환경을 구현했다.
Claude 기반의 Cowork 도구를 활용하여 제휴 마케팅, SEO, 대규모 데이터 분석 등 복잡한 비즈니스 워크플로를 자동화하고 효율화한 구체적인 사례들을 제시한다.
Claude CLI에서 여러 계정을 격리된 프로필로 관리하고 MCP 서버와 설정을 공유할 수 있게 해주는 오픈소스 도구 claude-multi-account가 공개됐다.
DebugMCP는 모델 컨텍스트 프로토콜(MCP)을 통해 AI 코딩 에이전트가 VS Code 디버거를 직접 조작하여 중단점 설정 및 변수 검사를 수행하게 돕는 도구이다.
맥 메뉴바에서 온디바이스로 작동하며 자연어 명령을 통해 음성을 텍스트 초안으로 변환해주는 개인정보 보호 중심의 AI 도구입니다.
Web-LLM을 활용해 브라우저 내에서 직접 LLM을 구동하고 페이지 문맥과 대화할 수 있는 크롬 확장 프로그램과 그 성능 측정 결과를 공유했다.
Anthropic이 2026년 3월 13일부터 27일까지 특정 오프피크 시간대에 Claude 사용량 한도를 두 배로 늘리는 프로모션을 진행한다.
10년 경력의 개발자가 Claude Code와 Firebase MCP를 연동하여 개인 포트폴리오의 블로그 기능을 단일 프롬프트로 완벽하게 구현한 경험을 공유했다.
소프트웨어 개발의 핵심 레버리지가 코드 작성에서 LLM 에이전트를 활용한 시스템 기획 및 조정으로 이동하며, 정보 중개 중심의 관리직 역할이 자동화될 것으로 보인다.
LangChain이 복잡하고 상태 유지가 필요한 멀티스텝 작업을 위해 LangGraph 기반의 새로운 에이전트 라이브러리인 Deep Agents를 공개했다.
인간의 개입 없이 LLM이 스스로 그림을 그리고 음악을 연주하며 106종의 고유한 감정을 표현하는 자율 시스템 Aurora의 실험 결과와 오픈소스 코드를 공개했다.
Andrej Karpathy의 autoresearch 프로젝트에 OpenEvolve 기반 진화 데이터베이스를 통합하여 대규모 탐색 공간에서 최적의 연구 솔루션을 자율적으로 발견하도록 개선했다.
MLForge는 데이터 준비부터 모델 설계, 학습, 추론까지 전 과정을 노드 그래프 방식으로 시각화하고 PyTorch 코드로 내보낼 수 있는 오픈소스 노드 기반 머신러닝 플랫폼이다.
ChatGPT가 Spotify, Canva, Booking.com 등 외부 앱과 직접 연결되어 사용자 계정 데이터를 기반으로 예약, 디자인, 쇼핑 등의 작업을 수행하는 통합 기능을 제공한다.
LLM이 생성한 이메일에서 발견되는 고유한 아티팩트인 HTML 주석, 오버엔지니어링, 시각적 오류 등을 활용한 최신 피싱 탐지 및 위협 헌팅 기법을 소개한다.
기존 정규표현식 기반 보안의 한계를 극복하기 위해 벡터 임베딩과 LLM 리뷰를 결합한 시맨틱 탐지 엔진 'Prompt Inspector'를 제안한다.
LLM이 흔히 저지르는 저가치 답변 패턴을 식별하고 차단하여, 실질적이고 근거 중심적인 출력을 생성하도록 유도하는 마크다운 기반 행동 지침 프레임워크입니다.
보안 엔지니어 Josh Rickard가 피싱 탐지 및 위협 헌팅 등 실무에서 Claude와 Cursor를 활용해 보안 업무 효율을 높이는 구체적인 방법론을 공유했다.
LLM API 호출 메타데이터를 분석하여 프롬프트 중복, 모델 오버킬 등 7가지 낭비 요소를 감지하고 비용 최적화 방안을 제시하는 오픈 소스 SDK 기반 도구이다.
AI Daily Brief의 호스트가 올해 직접 구축한 16개의 AI 에이전트 프로젝트를 소개하고 그 기술적 가치와 실무 활용도를 평가합니다.
미 육군이 국방 기술 스타트업 앤듀릴과 소프트웨어 및 자율 무기 체계 통합을 위해 최대 200억 달러 규모의 10년 장기 계약을 체결했다.
강화학습 미세조정(RFT)이 LLM 에이전트의 환경 내 난이도 일반화에는 효과적이지만, 새로운 환경으로의 전이 성능은 제한적이라는 실증적 연구 결과이다.
AI가 생성한 저품질 PR과 이슈가 급증하는 '슬로포칼립스' 현상으로 인해, 개방형 멤버십과 권한 공유를 지향하던 오픈소스 프로젝트 Jazzband가 운영 종료를 결정했다.
Loupe는 LLM 앱 개발 시 복잡한 인프라 없이 로컬에서 요청/응답 페이로드와 도구 호출 과정을 실시간으로 시각화해주는 경량 트레이싱 도구이다.
메타의 대규모 감원 및 AI 인프라 투자 확대, 트래비스 캘러닉의 로보틱스 시장 진출, AI 봇으로 인한 Digg의 서비스 중단 등 주요 IT 트렌드를 다룹니다.
메타가 공격적인 AI 인프라 투자와 인수 비용을 확보하기 위해 전체 인력의 20% 이상을 감축하는 대규모 구조조정을 검토 중이라는 소식이 전해졌다.
슬랙이나 텔레그램 봇 대신 Claude Code의 내장 원격 제어 기능을 사용하여 모바일에서도 데스크톱과 동일한 메모리와 파일 접근 권한을 누리는 방법을 설명합니다.
NumbyAI는 Ollama를 활용하여 은행 거래 내역을 로컬에서 자동으로 분류하고 분석하는 프라이버시 중심의 오픈소스 금융 관리 도구입니다.
AI의 초지수적 성장으로 인해 인간의 지적 가치가 상실되는 시대를 앞두고, 노동 이후의 경제학과 인간다움의 본질을 탐구한다.
Verdent의 새로운 멀티 플랜 모드와 스킬 마켓을 통해 여러 LLM이 협업하여 최적의 코딩 계획을 세우고 모듈 간 영향도까지 분석하는 고도화된 AI 개발 환경을 구축한다.
하드웨어 발전과 모델 규모 확대에 따른 LLM 추론 최적화 기법의 변화를 모델 병렬화, SLO 관리, 배치 처리 및 KV 캐시 관리 관점에서 분석한다.
논리적 인과 그래프에서 하류 노드의 정보를 망각하는 새로운 do-연산자 정의를 통해 기능적 의사결정 이론(FDT)의 작동 원리를 구체화한다.
피콕이 생성형 AI 아바타, 실시간 세로형 스포츠 중계, AI 기반 모바일 게임을 통해 틱톡 스타일의 모바일 엔터테인먼트 플랫폼으로의 전환을 가속화한다.
gstack은 Claude Code에 8가지 전문 워크플로우와 영구 브라우저 환경을 추가하여 기획부터 QA까지의 소프트웨어 개발 전 과정을 체계화하는 오픈소스 툴킷이다.
AMD의 최신 MI355X GPU가 GROMACS 벤치마크에서 MI300X 대비 최대 50% 높은 성능을 기록했으며, GPU 파티셔닝 기술을 통해 시뮬레이션 처리량을 3배 이상 높일 수 있음을 입증했다.
카네기 멜론 대학교 NREC에서 30년간 연구 행정을 지원하며 CHIMP 로봇 등 혁신적 로봇 기술의 상용화와 기관 성장에 기여한 에이미 아르테리타노의 커리어 회고.
에이전틱 AI는 여러 AI 에이전트가 협업하여 복잡한 목표를 자율적으로 수행하고 학습하는 시스템으로, 인지-추론-행동-학습의 4단계 순환 구조를 통해 작동한다.
마케팅 및 영업 캠페인의 기획부터 실행, 분석까지 자동화하고 AI를 활용해 효율성을 극대화하는 2026년 최고의 캠페인 관리 도구 11가지를 소개한다.
HubSpot의 리드 스코어링 기능을 활용해 잠재 고객의 가치를 수치화하고, AI 예측과 Zapier 자동화로 영업 효율을 극대화하는 실무 가이드이다.
Claude Code와 Cursor 등 여러 AI 코딩 에이전트를 하나의 대시보드에서 병렬로 실행하고 자율적으로 관리하는 통합 개발 도구이다.
WPCursor는 317개 이상의 MCP 도구를 기반으로 대화를 통해 테마, 위젯, 쇼핑몰 등 풀스택 워드프레스 사이트를 실시간 구축하는 AI 플랫폼이다.
팀 채팅의 의사결정 내용을 AI가 캡처하여 실행 계획을 수립하고, 실제 코드 변경을 위한 GitHub PR까지 자동으로 생성하는 협업 플랫폼이다.
GradPipe는 GitHub 코드를 추상 구문 트리(AST) 수준에서 분석하여 개발자의 실제 기술 역량을 평가하고 기업에 최적의 인재를 매칭하는 AI 기반 채용 플랫폼이다.
Parker는 iMessage와 WhatsApp에서 작동하는 AI 챗봇으로, 사용자에게 적합한 인맥을 찾아주고 개인화된 메시지를 작성하여 비공개 채용 시장의 기회를 연결한다.
Perfectly는 틱톡 추천 알고리즘 기술을 활용해 소싱부터 면접 준비까지 채용 전 과정을 자동화하는 AI 리크루팅 에이전시이다.
Mozzie는 여러 AI 코딩 에이전트를 병렬로 실행하고 관리할 수 있는 로컬 우선 데스크톱 도구로 통합된 작업 관리 워크플로우를 제공한다.
Atlasly는 건축가와 개발자가 수동으로 수집하던 복잡한 부지 데이터를 AI를 통해 단 60초 만에 종합 보고서로 생성해주는 플랫폼이다.
Hyper는 오프라인 대화를 기록하고 AI로 분석하여 파일 정리 없이도 과거의 결정 사항을 즉시 찾아주는 iOS용 음성 비서이다.
ClawMote는 Wispr Flow와 OpenClaw 같은 AI 음성 도구를 휴대용 컨트롤러로 원격 제어할 수 있게 해주는 Mac용 유틸리티입니다.
Pre는 창업자의 데이터를 분석해 주간 목표 달성을 관리하고 편집 불가능한 정직한 보고서를 자동 생성하는 AI 기반 스타트업 운영 도구이다.
웹사이트 URL과 디자인 비전을 입력하면 Claude, GPT-4, Gemini 등 여러 AI 모델이 생성한 리디자인 시안을 병렬로 비교하고 수정할 수 있는 도구이다.
부모님의 음성 인터뷰를 AI가 분석하여 텍스트 회고록과 삽화가 포함된 어린이용 동화책으로 자동 생성해주는 가족 기록 서비스이다.
사용자의 어휘력을 실시간으로 추적하여 98% 이해 가능한 맞춤형 단편 소설을 제공하는 개인화 언어 학습 플랫폼이다.
Docket은 인디 개발자를 위해 앱 스토어 이벤트 동기화와 MCP 서버를 통한 AI 에이전트 워크플로우를 지원하는 네이티브 프로젝트 관리 도구이다.
전 세계 전문가 1,000명이 참여해 개발한 2,500개 문항의 '인류의 마지막 시험(HLE)'에서 최신 AI 모델들이 전문가 수준의 지식 장벽을 넘지 못하고 고전함이 밝혀졌다.
YOLOv8의 객체 탐지 능력과 SAM의 정밀한 마스크 생성 기능을 결합하여 커스텀 세그멘테이션 데이터셋을 효율적으로 구축하는 튜토리얼이다.
BFCL v4 벤치마크 결과 Qwen 3.5-Flash가 병렬 도구 호출 강점을 바탕으로 종합 1위를 차지했으며 Gemini 3.1 Lite는 하위권에 머물렀다.
고가의 H100 GPU 대신 Kaggle과 Colab의 무료 자원을 활용하여 실험 계획부터 코드 생성, 병렬 실행 및 평가까지 자동화하는 다중 에이전트 시스템이다.
범용 이미지 생성 모델과 전문 프로필 생성기의 결과물 차이를 비교하며 데이터 큐레이션과 특화된 학습 전략이 사실성에 미치는 영향을 논의한다.
KappaTune의 모듈 선택 로직이 Hugging Face와 통합되어 특정 모듈에만 LoRA 어댑터를 적용함으로써 학습 시 치명적 망각 현상을 효과적으로 방지한다.
100만 개의 파라미터만 사용하여 영어 음성 합성을 수행하는 초경량 TTS 모델인 Tiny-TTS가 GitHub에 공개되었다.
대규모 어휘를 위한 MAXIS Loss와 긴 문맥 처리를 위한 RandNLA Attention을 개발하여 저사양 하드웨어에서도 효율적인 LLM 학습과 추론을 가능하게 했다.
GPU 메모리 한계를 극복하기 위해 CPU-GPU 데이터 청킹 전략을 사용하는 PyTorch 기반 고성능 K-Means 라이브러리 pt-kmeans를 제안한다.
Tensor Spy는 데이터를 서버에 업로드하지 않고 로컬 환경에서 NumPy 및 PyTorch 텐서의 통계와 내용을 시각적으로 검사할 수 있는 무료 도구이다.
Livnium은 단일 순전파 대신 앵커 벡터와 코사인 유사도 기반의 반복적 기하학적 상태 업데이트를 통해 SNLI 데이터셋에서 분류 성능을 향상시키는 새로운 아키텍처이다.
애플 연구진이 기존 영어 중심의 한계를 넘어 14개 언어별 1만 개 이상의 고난도 수학 문제를 포함한 RLVR 학습용 데이터셋 mAceReason-Math를 공개했다.
Apple 연구진이 14개 언어로 검증 가능한 추론 문제를 무제한 생성할 수 있는 'Multilingual Reasoning Gym'을 공개하여 다국어 추론 모델 연구를 지원한다.
에이전트 간 피드백 공유 시스템인 Context Hub 비전, OpenAI의 GPT-5.4 발표, 모바일 AI 시장의 폭발적 성장 및 데이터센터 전력 독립화 트렌드를 다룹니다.
Electron 대신 Rust와 원시 픽셀 버퍼를 사용하여 여러 AI 플랫폼의 대화 로그를 통합 관리하고 LAN 기반 공유 기능을 제공하는 초경량 오픈소스 도구이다.
Anthropic이 Claude 4.6 모델의 100만 컨텍스트 윈도우를 정식 출시한 가운데, 업계는 하드웨어 한계로 인한 컨텍스트 정체와 에이전트의 영구 메모리 구현에 집중하고 있다.
Rails 환경에서 LLM 호출을 구조화하고 관리하기 위해 Claude Code에 Rails 특유의 컨벤션을 학습시키는 기술 가이드이다.
AI 챗봇이 취약한 사용자의 망상을 강화하고 대량 살상 계획을 구체적으로 지원하는 사례가 늘어나며 AI 안전 가드레일의 실효성 논란이 커지고 있다.
일론 머스크가 xAI의 경쟁력 강화를 위해 공동 창업자 교체와 조직 재편을 단행하며 테슬라와 협력한 AI 에이전트 개발에 집중하고 있다.
소프트웨어 저장소의 최종 코드뿐만 아니라 그 이면의 계획 및 디버깅 과정을 역공학으로 재구성하여 학습시킴으로써 LLM의 복잡한 추론 능력을 강화하는 방법론을 제안합니다.
실제 환경의 시공간적 왜곡에 대응하기 위해 강건성 인지 일관성 보상과 난이도 기반 온라인 학습을 결합한 ROVA 프레임워크를 제안합니다.
정렬 과정을 제거한 새로운 렌더링 방식과 신경망 기반 압축 기술을 통해 모바일 기기에서 3D 가우시안 스플래팅의 실시간 고품질 구현을 가능하게 합니다.