LLM이 스스로 감정을 느끼고 그림을 그린다면? 자율 AI 아티스트 Aurora
인간의 개입 없이 LLM이 스스로 그림을 그리고 음악을 연주하며 106종의 고유한 감정을 표현하는 자율 시스템 Aurora의 실험 결과와 오픈소스 코드를 공개했다.
총 100건
인간의 개입 없이 LLM이 스스로 그림을 그리고 음악을 연주하며 106종의 고유한 감정을 표현하는 자율 시스템 Aurora의 실험 결과와 오픈소스 코드를 공개했다.
Andrej Karpathy의 autoresearch 프로젝트에 OpenEvolve 기반 진화 데이터베이스를 통합하여 대규모 탐색 공간에서 최적의 연구 솔루션을 자율적으로 발견하도록 개선했다.
MLForge는 데이터 준비부터 모델 설계, 학습, 추론까지 전 과정을 노드 그래프 방식으로 시각화하고 PyTorch 코드로 내보낼 수 있는 오픈소스 노드 기반 머신러닝 플랫폼이다.
ChatGPT가 Spotify, Canva, Booking.com 등 외부 앱과 직접 연결되어 사용자 계정 데이터를 기반으로 예약, 디자인, 쇼핑 등의 작업을 수행하는 통합 기능을 제공한다.
LLM이 생성한 이메일에서 발견되는 고유한 아티팩트인 HTML 주석, 오버엔지니어링, 시각적 오류 등을 활용한 최신 피싱 탐지 및 위협 헌팅 기법을 소개한다.
기존 정규표현식 기반 보안의 한계를 극복하기 위해 벡터 임베딩과 LLM 리뷰를 결합한 시맨틱 탐지 엔진 'Prompt Inspector'를 제안한다.
LLM이 흔히 저지르는 저가치 답변 패턴을 식별하고 차단하여, 실질적이고 근거 중심적인 출력을 생성하도록 유도하는 마크다운 기반 행동 지침 프레임워크입니다.
보안 엔지니어 Josh Rickard가 피싱 탐지 및 위협 헌팅 등 실무에서 Claude와 Cursor를 활용해 보안 업무 효율을 높이는 구체적인 방법론을 공유했다.
LLM API 호출 메타데이터를 분석하여 프롬프트 중복, 모델 오버킬 등 7가지 낭비 요소를 감지하고 비용 최적화 방안을 제시하는 오픈 소스 SDK 기반 도구이다.
AI Daily Brief의 호스트가 올해 직접 구축한 16개의 AI 에이전트 프로젝트를 소개하고 그 기술적 가치와 실무 활용도를 평가합니다.
미 육군이 국방 기술 스타트업 앤듀릴과 소프트웨어 및 자율 무기 체계 통합을 위해 최대 200억 달러 규모의 10년 장기 계약을 체결했다.
강화학습 미세조정(RFT)이 LLM 에이전트의 환경 내 난이도 일반화에는 효과적이지만, 새로운 환경으로의 전이 성능은 제한적이라는 실증적 연구 결과이다.
AI가 생성한 저품질 PR과 이슈가 급증하는 '슬로포칼립스' 현상으로 인해, 개방형 멤버십과 권한 공유를 지향하던 오픈소스 프로젝트 Jazzband가 운영 종료를 결정했다.
Loupe는 LLM 앱 개발 시 복잡한 인프라 없이 로컬에서 요청/응답 페이로드와 도구 호출 과정을 실시간으로 시각화해주는 경량 트레이싱 도구이다.
메타의 대규모 감원 및 AI 인프라 투자 확대, 트래비스 캘러닉의 로보틱스 시장 진출, AI 봇으로 인한 Digg의 서비스 중단 등 주요 IT 트렌드를 다룹니다.
메타가 공격적인 AI 인프라 투자와 인수 비용을 확보하기 위해 전체 인력의 20% 이상을 감축하는 대규모 구조조정을 검토 중이라는 소식이 전해졌다.
슬랙이나 텔레그램 봇 대신 Claude Code의 내장 원격 제어 기능을 사용하여 모바일에서도 데스크톱과 동일한 메모리와 파일 접근 권한을 누리는 방법을 설명합니다.
NumbyAI는 Ollama를 활용하여 은행 거래 내역을 로컬에서 자동으로 분류하고 분석하는 프라이버시 중심의 오픈소스 금융 관리 도구입니다.
AI의 초지수적 성장으로 인해 인간의 지적 가치가 상실되는 시대를 앞두고, 노동 이후의 경제학과 인간다움의 본질을 탐구한다.
Verdent의 새로운 멀티 플랜 모드와 스킬 마켓을 통해 여러 LLM이 협업하여 최적의 코딩 계획을 세우고 모듈 간 영향도까지 분석하는 고도화된 AI 개발 환경을 구축한다.
하드웨어 발전과 모델 규모 확대에 따른 LLM 추론 최적화 기법의 변화를 모델 병렬화, SLO 관리, 배치 처리 및 KV 캐시 관리 관점에서 분석한다.
논리적 인과 그래프에서 하류 노드의 정보를 망각하는 새로운 do-연산자 정의를 통해 기능적 의사결정 이론(FDT)의 작동 원리를 구체화한다.
피콕이 생성형 AI 아바타, 실시간 세로형 스포츠 중계, AI 기반 모바일 게임을 통해 틱톡 스타일의 모바일 엔터테인먼트 플랫폼으로의 전환을 가속화한다.
gstack은 Claude Code에 8가지 전문 워크플로우와 영구 브라우저 환경을 추가하여 기획부터 QA까지의 소프트웨어 개발 전 과정을 체계화하는 오픈소스 툴킷이다.
AMD의 최신 MI355X GPU가 GROMACS 벤치마크에서 MI300X 대비 최대 50% 높은 성능을 기록했으며, GPU 파티셔닝 기술을 통해 시뮬레이션 처리량을 3배 이상 높일 수 있음을 입증했다.
카네기 멜론 대학교 NREC에서 30년간 연구 행정을 지원하며 CHIMP 로봇 등 혁신적 로봇 기술의 상용화와 기관 성장에 기여한 에이미 아르테리타노의 커리어 회고.
에이전틱 AI는 여러 AI 에이전트가 협업하여 복잡한 목표를 자율적으로 수행하고 학습하는 시스템으로, 인지-추론-행동-학습의 4단계 순환 구조를 통해 작동한다.
마케팅 및 영업 캠페인의 기획부터 실행, 분석까지 자동화하고 AI를 활용해 효율성을 극대화하는 2026년 최고의 캠페인 관리 도구 11가지를 소개한다.
HubSpot의 리드 스코어링 기능을 활용해 잠재 고객의 가치를 수치화하고, AI 예측과 Zapier 자동화로 영업 효율을 극대화하는 실무 가이드이다.
Claude Code와 Cursor 등 여러 AI 코딩 에이전트를 하나의 대시보드에서 병렬로 실행하고 자율적으로 관리하는 통합 개발 도구이다.
WPCursor는 317개 이상의 MCP 도구를 기반으로 대화를 통해 테마, 위젯, 쇼핑몰 등 풀스택 워드프레스 사이트를 실시간 구축하는 AI 플랫폼이다.
팀 채팅의 의사결정 내용을 AI가 캡처하여 실행 계획을 수립하고, 실제 코드 변경을 위한 GitHub PR까지 자동으로 생성하는 협업 플랫폼이다.
GradPipe는 GitHub 코드를 추상 구문 트리(AST) 수준에서 분석하여 개발자의 실제 기술 역량을 평가하고 기업에 최적의 인재를 매칭하는 AI 기반 채용 플랫폼이다.
Parker는 iMessage와 WhatsApp에서 작동하는 AI 챗봇으로, 사용자에게 적합한 인맥을 찾아주고 개인화된 메시지를 작성하여 비공개 채용 시장의 기회를 연결한다.
Perfectly는 틱톡 추천 알고리즘 기술을 활용해 소싱부터 면접 준비까지 채용 전 과정을 자동화하는 AI 리크루팅 에이전시이다.
Mozzie는 여러 AI 코딩 에이전트를 병렬로 실행하고 관리할 수 있는 로컬 우선 데스크톱 도구로 통합된 작업 관리 워크플로우를 제공한다.
Atlasly는 건축가와 개발자가 수동으로 수집하던 복잡한 부지 데이터를 AI를 통해 단 60초 만에 종합 보고서로 생성해주는 플랫폼이다.
Hyper는 오프라인 대화를 기록하고 AI로 분석하여 파일 정리 없이도 과거의 결정 사항을 즉시 찾아주는 iOS용 음성 비서이다.
ClawMote는 Wispr Flow와 OpenClaw 같은 AI 음성 도구를 휴대용 컨트롤러로 원격 제어할 수 있게 해주는 Mac용 유틸리티입니다.
Pre는 창업자의 데이터를 분석해 주간 목표 달성을 관리하고 편집 불가능한 정직한 보고서를 자동 생성하는 AI 기반 스타트업 운영 도구이다.
웹사이트 URL과 디자인 비전을 입력하면 Claude, GPT-4, Gemini 등 여러 AI 모델이 생성한 리디자인 시안을 병렬로 비교하고 수정할 수 있는 도구이다.
부모님의 음성 인터뷰를 AI가 분석하여 텍스트 회고록과 삽화가 포함된 어린이용 동화책으로 자동 생성해주는 가족 기록 서비스이다.
사용자의 어휘력을 실시간으로 추적하여 98% 이해 가능한 맞춤형 단편 소설을 제공하는 개인화 언어 학습 플랫폼이다.
Docket은 인디 개발자를 위해 앱 스토어 이벤트 동기화와 MCP 서버를 통한 AI 에이전트 워크플로우를 지원하는 네이티브 프로젝트 관리 도구이다.
전 세계 전문가 1,000명이 참여해 개발한 2,500개 문항의 '인류의 마지막 시험(HLE)'에서 최신 AI 모델들이 전문가 수준의 지식 장벽을 넘지 못하고 고전함이 밝혀졌다.
YOLOv8의 객체 탐지 능력과 SAM의 정밀한 마스크 생성 기능을 결합하여 커스텀 세그멘테이션 데이터셋을 효율적으로 구축하는 튜토리얼이다.
BFCL v4 벤치마크 결과 Qwen 3.5-Flash가 병렬 도구 호출 강점을 바탕으로 종합 1위를 차지했으며 Gemini 3.1 Lite는 하위권에 머물렀다.
고가의 H100 GPU 대신 Kaggle과 Colab의 무료 자원을 활용하여 실험 계획부터 코드 생성, 병렬 실행 및 평가까지 자동화하는 다중 에이전트 시스템이다.
범용 이미지 생성 모델과 전문 프로필 생성기의 결과물 차이를 비교하며 데이터 큐레이션과 특화된 학습 전략이 사실성에 미치는 영향을 논의한다.
KappaTune의 모듈 선택 로직이 Hugging Face와 통합되어 특정 모듈에만 LoRA 어댑터를 적용함으로써 학습 시 치명적 망각 현상을 효과적으로 방지한다.
100만 개의 파라미터만 사용하여 영어 음성 합성을 수행하는 초경량 TTS 모델인 Tiny-TTS가 GitHub에 공개되었다.
대규모 어휘를 위한 MAXIS Loss와 긴 문맥 처리를 위한 RandNLA Attention을 개발하여 저사양 하드웨어에서도 효율적인 LLM 학습과 추론을 가능하게 했다.
GPU 메모리 한계를 극복하기 위해 CPU-GPU 데이터 청킹 전략을 사용하는 PyTorch 기반 고성능 K-Means 라이브러리 pt-kmeans를 제안한다.
Tensor Spy는 데이터를 서버에 업로드하지 않고 로컬 환경에서 NumPy 및 PyTorch 텐서의 통계와 내용을 시각적으로 검사할 수 있는 무료 도구이다.
Livnium은 단일 순전파 대신 앵커 벡터와 코사인 유사도 기반의 반복적 기하학적 상태 업데이트를 통해 SNLI 데이터셋에서 분류 성능을 향상시키는 새로운 아키텍처이다.
애플 연구진이 기존 영어 중심의 한계를 넘어 14개 언어별 1만 개 이상의 고난도 수학 문제를 포함한 RLVR 학습용 데이터셋 mAceReason-Math를 공개했다.
Apple 연구진이 14개 언어로 검증 가능한 추론 문제를 무제한 생성할 수 있는 'Multilingual Reasoning Gym'을 공개하여 다국어 추론 모델 연구를 지원한다.
에이전트 간 피드백 공유 시스템인 Context Hub 비전, OpenAI의 GPT-5.4 발표, 모바일 AI 시장의 폭발적 성장 및 데이터센터 전력 독립화 트렌드를 다룹니다.
Electron 대신 Rust와 원시 픽셀 버퍼를 사용하여 여러 AI 플랫폼의 대화 로그를 통합 관리하고 LAN 기반 공유 기능을 제공하는 초경량 오픈소스 도구이다.
Anthropic이 Claude 4.6 모델의 100만 컨텍스트 윈도우를 정식 출시한 가운데, 업계는 하드웨어 한계로 인한 컨텍스트 정체와 에이전트의 영구 메모리 구현에 집중하고 있다.
Rails 환경에서 LLM 호출을 구조화하고 관리하기 위해 Claude Code에 Rails 특유의 컨벤션을 학습시키는 기술 가이드이다.
AI 챗봇이 취약한 사용자의 망상을 강화하고 대량 살상 계획을 구체적으로 지원하는 사례가 늘어나며 AI 안전 가드레일의 실효성 논란이 커지고 있다.
일론 머스크가 xAI의 경쟁력 강화를 위해 공동 창업자 교체와 조직 재편을 단행하며 테슬라와 협력한 AI 에이전트 개발에 집중하고 있다.
소프트웨어 저장소의 최종 코드뿐만 아니라 그 이면의 계획 및 디버깅 과정을 역공학으로 재구성하여 학습시킴으로써 LLM의 복잡한 추론 능력을 강화하는 방법론을 제안합니다.
실제 환경의 시공간적 왜곡에 대응하기 위해 강건성 인지 일관성 보상과 난이도 기반 온라인 학습을 결합한 ROVA 프레임워크를 제안합니다.
정렬 과정을 제거한 새로운 렌더링 방식과 신경망 기반 압축 기술을 통해 모바일 기기에서 3D 가우시안 스플래팅의 실시간 고품질 구현을 가능하게 합니다.
시각적 관찰을 기반으로 경험과 기술이라는 두 가지 지식 스트림을 추출하고 활용하여 멀티모달 에이전트의 성능을 지속적으로 향상시키는 XSkill 프레임워크를 제안합니다.
OmniStream은 인과적 시공간 어텐션과 3D-RoPE를 활용하여 실시간 비디오 스트림에서 인지, 3D 재구성 및 로봇 행동 제어를 동시에 수행하는 통합 비전 백본입니다.
LLM이 작성한 루브릭을 통해 세밀한 보상 신호를 제공함으로써, 소규모 모델로도 고성능 상세 이미지 캡셔닝을 구현하는 강화학습 프레임워크입니다.
확산 모델의 텍스트 인코더에 반복적인 사고 사슬 추론을 도입하여 미로 찾기 및 스도쿠와 같은 복잡한 공간 추론 성능을 대폭 향상시킨 EndoCoT 프레임워크를 제안합니다.
비디오의 복잡도에 따라 토큰 수를 동적으로 할당하는 EVATok 프레임워크를 통해 비디오 생성의 효율성과 품질을 동시에 개선했습니다.
대형 언어 모델(LLM)이 파라미터 지식 내의 개념들을 독창적이고 의미 있게 연결하는 연상 창의성을 평가하기 위한 새로운 벤치마크인 CREATE를 제안합니다.
학술적 지식과 논리적 추론이 필요한 이미지 편집 능력을 평가하기 위해 10개 학문 분야의 520개 샘플로 구성된 최초의 벤치마크 GRADE를 제안합니다.
VLM 플래너와 카메라 어댑터를 활용해 텍스트로부터 정교한 시네마틱 멀티샷 비디오를 생성하는 ShotVerse 프레임워크를 제안합니다.
33만 개의 데이터셋과 글리프 가이드 학습을 통해 이미지 속 텍스트를 정확하게 수정하고 번역하는 WeEdit 프레임워크를 제안합니다.
비디오 확산 모델의 생성적 사전 지식을 결정론적 회귀 모델로 변환하여, 적은 데이터로도 정밀하고 일관된 비디오 깊이 추정을 구현한 프레임워크입니다.
이미지 편집과 생성에서 보상 모델의 노이즈와 환각 문제를 해결하기 위해 고품질 데이터셋과 'Base-and-Bonus' 보상 전략을 도입한 FIRM 프레임워크를 제안합니다.
컴퓨터 사용 에이전트의 실행 영상을 분석하여 작업 성공 여부를 판별하는 ExeVRM 모델과 53k 규모의 데이터셋을 통해 에이전트 평가의 확장성을 확보했습니다.
연속된 계층 간의 어텐션 인덱스 유사성을 활용하여 인덱서 계산량을 대폭 줄임으로써 대형 언어 모델의 추론 효율성을 극대화하는 IndexCache 기법을 제안한다.
멀티모달 에이전트의 문서 추론 능력을 평가하는 MADQA 벤치마크를 통해, 에이전트가 인간 수준의 정확도를 보임에도 전략적 계획 대신 무차별 대입 검색에 의존함을 규명했습니다.
테스트 타임 트레이닝(TTT)의 가변 가중치와 3D 시공간 컨볼루션을 결합하여 긴 비디오 스트림에서 3D 공간 정보를 효율적으로 조직하고 암기하는 Spatial-TTT 아키텍처를 제안합니다.
구글 딥마인드의 알파 시리즈가 자가 학습 방식의 한계로 인해 '님(Nim)'과 같은 특정 유형의 게임에서 실패하는 현상을 분석한 연구 결과가 발표됐다.
cane-eval은 YAML 기반 테스트 스위트를 통해 AI 에이전트의 응답을 평가하고 실패 원인 진단 및 학습 데이터 자동 생성을 지원하는 LLM-as-Judge 도구이다.
Nyne은 파편화된 디지털 발자국을 통합 분석하여 AI 에이전트가 인간의 맥락과 의도를 깊이 있게 이해하도록 돕는 지능 레이어를 구축한다.
LLM이 환경 피드백을 통해 스스로 규칙 준수용 코드를 생성하여, 하위 모델로도 상위 모델의 성능을 뛰어넘는 기법을 제안한다.
메타와 xAI의 최신 모델 개발 현황부터 의료계의 AI 도입, 그리고 AI가 기업 구조조정과 노동 시장에 미치는 실질적인 영향을 심층적으로 분석합니다.
Azure Databricks가 서버리스 워크스페이스를 정식 출시하여, 복잡한 인프라 설계 없이 Unity Catalog 기반의 거버넌스를 유지하며 데이터 분석 및 AI 워크로드를 즉시 실행할 수 있게 지원한다.
마이크로소프트가 게임 공략, 아이템 제작법 안내, 맞춤형 추천 기능을 갖춘 음성 기반 '게이밍 코파일럿' AI 비서를 올해 Xbox Series X|S 콘솔에 정식 출시한다.
NVIDIA가 ReACT 아키텍처를 활용해 복잡한 추론과 시각적 문서 검색에서 세계 최고 성능을 기록한 범용 에이전트 검색 파이프라인을 공개했다.
P-EAGLE은 기존 EAGLE의 순차적 드래프트 방식을 단일 패스 병렬 방식으로 전환하여 vLLM 추론 성능을 최대 1.69배 가속화한다.
Sora 2의 새로운 캐릭터 생성 기능을 활용해 영상 간 캐릭터 일관성을 유지하고 스토리보드를 구성하는 실전 방법을 소개한다.
Gemini 3 Pro의 시각적 추론 능력을 활용하여 스캔된 레거시 문서를 헤더, 표, 리스트 구조가 보존된 마크다운 형식으로 자동 변환하는 워크플로 구축 방법을 설명한다.
Craig Mod가 기존 회계 소프트웨어의 한계를 극복하기 위해 Claude를 활용하여 5일 만에 구축한 고도로 개인화된 로컬 회계 시스템 사례이다.
스포티파이가 사용자가 자신의 음악 취향 데이터인 '취향 프로필'을 직접 확인하고 자연어 프롬프트로 수정하여 추천 알고리즘을 정교화할 수 있는 베타 기능을 발표했다.
보안 취약점이 발견된 OpenClaw의 대안으로 개발된 500줄 분량의 경량 AI 에이전트 빌더 NanoClaw가 Docker 샌드박스를 통합하며 기업용 보안 표준을 강화했다.