수개월 걸리던 AI 에이전트 구축, 이제 단 며칠 만에 끝낸다
Anthropic의 관리형 에이전트 인프라 출시와 Meta의 차세대 추론 모델 Muse Spark, DeepSeek-V4의 초기 징후 등 최신 AI 기술 업데이트를 다룬다.
총 100건
Anthropic의 관리형 에이전트 인프라 출시와 Meta의 차세대 추론 모델 Muse Spark, DeepSeek-V4의 초기 징후 등 최신 AI 기술 업데이트를 다룬다.
AI 코딩 도구로 빠르게 개발된 앱들이 흔히 놓치는 데이터 휘발, 보안 유출, 컨텍스트 한계 등 5가지 기술적 결함과 그 해결 방법을 제시했다.
Bash의 텍스트 변환 과정에서 발생하는 정보 손실을 해결하기 위해 코드베이스를 Python REPL 환경으로 변환하여 에이전트의 추론 효율을 높이는 CORE 프레임워크가 제안됐다.
OpenAI Playground에 프로젝트 단위 프롬프트 관리, 버전 복구, 변수 지원 및 자동 최적화 도구가 추가되어 개발 워크플로가 개선됐다.
Claude의 출력을 엄격한 CSV 형식으로 제어하여 Canva의 대량 제작 기능과 오류 없이 연동하는 프롬프트 전략과 워크플로이다.
BANKING77 데이터셋에서 다중 뷰 인코더 적응 기법을 통해 기존 성능 정체를 극복하고 94.61%의 정확도를 기록했다.
Meta Superintelligence Labs가 완전히 새로운 기술 스택을 기반으로 개발한 첫 번째 프런티어 모델 Muse Spark를 발표하고 비공개 API 프리뷰를 시작했다.
확산 언어 모델(DLM)에서 기존의 토큰 선택 방식 대신 전문가 선택 방식을 도입하여 연산 효율을 극대화했다. 특히 디노이징 단계별로 전문가 처리 용량을 다르게 배정하는 기법을 통해 동일 연산량 대비 성능을 크게 개선하고 학습 속도를 2배 높였다.
고차원 fMRI 데이터는 막대한 메모리 요구량 때문에 긴 시간의 뇌 활동을 한꺼번에 분석하기 어려웠다. 이 논문은 일반 자연 이미지로 학습된 2D 오토인코더가 뇌 영상의 핵심 정보를 매우 효율적으로 압축할 수 있음을 증명하여, 기존보다 훨씬 긴 시간 범위의 뇌 역학을 Transformer로 모델링할 수 있는 길을 열었다.
인도 Sarvam AI의 MoE 추론 모델에서 거부 회로를 제거한 결과, 영어 기반의 거부 방향 제거가 힌디어 등 타 언어의 거부 반응까지 억제함을 확인했다.
iMessage와 텔레그램을 통해 일상 업무를 자동화하는 AI 에이전트 Poke가 3억 달러의 기업 가치를 인정받으며 추가 투자를 유치했다.
코드 저장소를 AI 에이전트가 즉시 이해할 수 있도록 70kb 규모의 결정론적 JSON 요약본으로 변환하는 CLI 도구 GitGalaxy가 공개됐다.
GitHub Copilot과 Claude를 활용해 Whisper 기반의 로컬 강의 전사 및 요약 Mac 앱인 'Lectio'를 개발한 사례이다.
개발자 도구 설계 시 인간 중심의 RESTful API와 문서화 방식이 AI 에이전트의 컨텍스트 제한과 작동 방식에는 오히려 방해가 된다는 실무적 통찰을 공유했다.
OpenAI는 기업용 매출 비중 40% 달성과 함께, 전사적 시스템을 연결하는 'Frontier' 지능 레이어와 통합 'AI 슈퍼앱' 구축 계획을 발표했다.
최근 빈번한 공급망 공격에 대응하여 Git 푸시 시 보안 취약점과 프롬프트 인젝션을 자동 스캔하고 차단하는 보안 도구 Agentiva가 출시됐다.
현재 AI 모델이 텍스트 토큰을 생성하며 사고하는 방식은 비효율적인 '가설물'에 불과하며, 잠재 공간에서의 비언어적 사고로의 전환이 필요하다.
특정 모델과 데이터 제약 조건을 충족할 경우 LLM의 환각 발생 확률이 0.01% 미만으로 떨어진다는 가설을 제시한다.
Amazon Bedrock에서 보상 신호를 활용해 모델을 최적화하는 강화 파인튜닝(RFT)의 핵심 원리와 데이터 설계 및 하이퍼파라미터 튜닝 모범 사례를 제시한다.
Amazon Nova 멀티모달 임베딩을 사용하여 오디오의 음조, 감정, 환경음을 벡터화하고 이를 통해 고도화된 의미론적 오디오 검색 시스템을 구축하는 방법을 제시한다.
메리 셸리의 소설 '프랑켄슈타인' 텍스트를 활용해 약 320만 개의 파라미터를 가진 Transformer 기반 LLM을 처음부터 구축하고 학습시키는 과정을 단계별로 설명합니다.
일론 머스크가 OpenAI와 샘 올트먼을 상대로 한 소송을 수정하여, 회수되는 모든 부당 이득을 자신이 아닌 OpenAI의 자선 비영리 부문에 반환할 것을 요구했다.
Anthropic이 장기 실행 에이전트의 안정성과 확장성을 위해 뇌(Claude)와 손(도구/샌드박스)을 분리한 Managed Agents 아키텍처를 공개했다.
Notion이 Claude Managed Agents를 통합하여 복잡한 워크플로를 자동화하고 사용자 맞춤형 에이전트 오케스트레이션 플랫폼을 구축한 사례를 다룹니다.
Astropad가 Mac Mini 등에서 실행되는 AI 에이전트를 iPad와 iPhone으로 실시간 모니터링하고 제어할 수 있는 'Workbench'를 출시했다.
메타가 멀티모달 입력과 추론 모드를 지원하는 새로운 AI 모델 시리즈의 첫 번째 모델인 Muse Spark를 발표했다.
구글이 개발한 에이전트 간 통신 표준인 A2A 프로토콜의 핵심 개념을 살펴보고, LangSmith Deployment를 통해 별도 설정 없이 에이전트 간 상호 운용성을 확보하는 방법을 실습합니다.
IBM의 Granite 모델을 활용하여 소음이 심한 환경에서도 정확한 음성 전사를 구현하는 기술적 진보를 다룬다.
AI 패션 앱 Alta Daily가 Meta의 Segment Anything Model(SAM)을 활용해 2,000만 개 이상의 의류 이미지를 정교하게 디지털화하고 개인화된 스타일링 서비스를 제공합니다.
유기적 소셜 미디어 마케팅으로 25,000명의 사용자를 확보한 AI SaaS Yorby의 성장 과정과 서버리스 환경에서 겪은 데이터베이스 연결 병목 현상을 해결한 기술적 경험을 공유한다.
ALTK-Evolve는 AI 에이전트의 실행 로그를 분석해 범용적인 가이드라인을 추출하고 이를 장기 기억으로 활용하여 복잡한 작업의 성공률을 높이는 시스템이다.
Ollama와 OpenCode를 활용해 구형 노트북에서도 Qwen3.5 4B 모델 기반의 로컬 코딩 에이전트 환경을 구축하는 실전 가이드입니다.
Stability AI의 Brand Studio를 활용하여 이미지 생성부터 아웃페인팅, 개체 제거까지 브랜드 맞춤형 콘텐츠를 제작하는 핵심 기능을 다룬다.
Anthropic이 데이터 유출 사고 이후 사이버 보안에 특화된 신규 모델 Claude Mythos Preview를 주요 기업 및 정부 기관을 대상으로 출시했다.
명령어 출력을 필터링 및 압축하여 LLM 토큰 사용량을 60-90% 절감하는 오픈소스 CLI 프록시 RTK가 공개됐다.
LLM 개발에 필요한 기초 개념부터 최신 인프라 기술까지 310개의 용어를 정리한 온라인 사전과 학습용 플래시카드가 공개됐다.
18개월간의 RAG 오픈소스 프로젝트 경험을 바탕으로 데이터 구조화부터 에이전틱 루프까지 22가지 RAG 아키텍처 패턴을 정리한 가이드이다.
MoE 아키텍처는 연산량 대비 성능이 뛰어나지만 거대한 메모리 점유율이 배포의 걸림돌이 된다. 이 논문은 단순히 전문가를 제거(Pruning)하는 대신 유사한 전문가를 병합(Merging)하는 REAM 방식을 통해, 메모리 사용량을 획기적으로 줄이면서도 모델의 지식을 보존하는 최적의 경로를 제시한다.
기존 RAG 평가는 최종 답변의 정답 여부에만 치중하여 검색된 개별 문서가 실제 추론 과정에서 어떤 역할을 하는지 파악하기 어려웠다. CUE-R은 개별 증거 항목에 대한 개입 분석을 통해 모델의 행동 변화를 다각도로 측정함으로써 RAG 시스템의 신뢰성과 내부 동작을 더 정밀하게 진단할 수 있게 한다.
과학 논문의 복잡한 도식을 편집 가능한 코드로 변환하는 것은 데이터 재사용성을 위해 중요하지만, TikZ 언어의 엄격한 문법과 정밀한 좌표 요구사항 때문에 기존 MLLM에게는 어려운 과제였다. 이 논문은 고품질 데이터 엔진과 양방향 검증 강화학습을 통해 시각적 정확도와 코드 실행 가능성을 획기적으로 높여 전문적인 과학 그래픽 합성을 가능하게 한다.
LLM이 코드를 고칠 때 멀쩡한 부분까지 다 갈아엎는 '과도한 수정(Over-editing)' 문제를 해결하여 코드 리뷰 효율성을 높였습니다. 최소한의 수정으로 버그를 고치도록 유도함으로써 추론 속도를 15% 가속하고 실무적인 코드 어시스턴트 성능을 확보했습니다.
기존 LLM 에이전트는 프롬프트 기반 추론이 강해질수록 오히려 현실적인 인간 행동에서 멀어지고 특정 성격만 과장되는 '가치 양극화' 현상을 보입니다. 이 논문은 심리학적 가치 이론을 아키텍처에 직접 통합하여, 110만 건의 실제 데이터를 통해 에이전트가 상황에 따라 유연하고 인간답게 행동하도록 개선했습니다.
코딩 에이전트는 수천 줄의 로그와 코드를 반복해서 읽으며 막대한 비용과 시간을 소모한다. 이 논문은 필요한 핵심 정보만 8% 수준으로 압축하면서도 중요한 단서는 놓치지 않는 경량 모델을 통해 에이전트의 추론 효율을 획기적으로 개선한다.
기존 AI 기반 논문 심사 시스템은 논문의 텍스트만 분석하여 저자의 주장을 그대로 수용하는 한계가 있었다. FactReview는 외부 문헌과 실제 소스 코드를 활용해 실험 수치를 직접 검증함으로써 AI가 단순한 요약 도구를 넘어 신뢰할 수 있는 증거 수집 도구로 진화할 수 있음을 보여준다.
기존 AI 에이전트는 새로운 작업을 마주할 때마다 처음부터 다시 배우는 경향이 있어 효율성이 낮았다. 이 논문은 과거의 경험을 구조, 속성, 과정 등 5가지 차원으로 분해하여 새로운 상황에 유연하게 적용하는 Echo 프레임워크를 통해 에이전트의 학습 속도와 적응력을 획기적으로 개선했다.
기존 멀티모달 임베딩 모델은 MLLM의 강력한 추론 능력을 충분히 활용하지 못하거나, 모든 입력에 추론을 강제하여 속도가 느려지는 문제가 있었다. 이 논문은 필요한 경우에만 선택적으로 추론을 수행하는 적응형 메커니즘을 도입하여 성능 향상과 효율성 확보라는 두 마리 토끼를 잡았다.
기존 로봇 제어 모델은 추상적인 숫자 명령어를 사용하여 비디오 생성 모델의 강력한 시각적 지식을 충분히 활용하지 못했다. 이 논문은 로봇의 행동을 '액션 이미지'라는 시각적 형태로 변환하여, 별도의 제어 모듈 없이도 비디오 모델이 직접 로봇을 움직이게 함으로써 미학습 환경에서의 적응력을 획기적으로 높였다.
MedGemma 1.5는 기존 2D 의료 영상 분석을 넘어 3D CT/MRI 부피 데이터와 초고해상도 병리 슬라이드 이미지를 단일 아키텍처에서 처리할 수 있는 오픈 소스 의료 특화 모델이다. 4B 파라미터의 효율적인 크기로 전문적인 의료 영상 진단 보조와 복잡한 의료 문서 구조화를 동시에 수행할 수 있어 차세대 의료 AI 시스템 구축의 핵심 기반이 될 것으로 기대된다.
네트워크 프루닝이 비생성적 작업(분류, 검색)에서는 효과적이지만 생성적 작업에서는 성능이 급락하는 불일치 현상의 근본 원인을 분석했다. 모델 내부의 로짓 공간과 확률 공간 사이의 비선형적 변화가 오차를 증폭시킨다는 점을 밝혀내어, 향후 더 안전하고 효율적인 LLM 압축 전략 수립에 기여한다.
기존 LLM은 학습이 끝나면 지식이 고정되어 새로운 정보를 실시간으로 받아들이기 어렵지만, 이 논문은 모델 구조 변경 없이 추론 중에 가중치를 업데이트하는 방식을 제안한다. 이를 통해 4B 규모의 작은 모델로도 128k 이상의 초장문 문맥을 효과적으로 처리할 수 있는 성능을 입증했다.
이메일, 일정 관리 등 실무에 LLM 에이전트가 도입되고 있으나 실제 서비스에서의 오작동은 돌이킬 수 없는 피해를 줄 수 있다. 이 논문은 고성능 모사 환경을 통해 에이전트의 업무 수행 능력과 보안 위험을 동시에 측정할 수 있는 벤치마크를 제공하여 안전한 에이전트 개발의 가이드라인을 제시한다.
확산 대형 언어 모델(dLLM)은 기존 순차적 생성 방식의 한계를 넘는 대안으로 주목받고 있으나, 연구 인프라가 파편화되어 알고리즘 간의 공정한 비교와 재현이 어려웠다. DARE는 서로 다른 dLLM 아키텍처와 강화학습 알고리즘을 하나의 표준화된 환경으로 통합하여 연구 효율성을 극대화하고 실질적인 성능 향상을 가능하게 한다.
기존의 단백질 설계 AI는 활성 부위를 미리 정의해야 하거나 서열과 구조를 따로 설계해야 하는 한계가 있었다. 이 논문은 서열과 3D 구조를 동시에 생성하는 멀티모달 확산 모델을 통해, 자연계에 존재하지 않는 새로운 화학 반응을 수행하는 효소를 재학습 없이도 정밀하게 설계할 수 있음을 입증했다.
폭발적으로 증가하는 학술 논문 속에서 연구자가 필요한 정보를 효율적으로 찾고 분석하는 것은 매우 어렵다. 이 논문은 단순 검색을 넘어 논문 내용을 구조화된 지식 그래프로 변환하고, 여러 에이전트가 협력하여 심층적인 분석과 리뷰를 제공함으로써 연구 워크플로우를 혁신적으로 단축시킨다.
기존에는 수천억 개의 파라미터를 가진 모델을 학습하려면 수십 대의 GPU가 필요했으나, 이 논문은 단 한 대의 GPU와 충분한 CPU 메모리만으로도 대규모 모델 학습이 가능함을 입증했다. 이는 고가의 GPU 자원이 부족한 중소 연구소나 개인 개발자들도 거대 모델의 미세 조정 및 학습에 참여할 수 있는 길을 열어준다.
LLM 에이전트의 능력을 확장하는 핵심 수단인 '스킬(Skill)'이 이상적인 실험실 환경을 벗어나 대규모 라이브러리에서 직접 검색하고 선택해야 하는 현실적인 상황에 놓일 때 성능이 얼마나 취약해지는지 분석했다. 특히 검색된 스킬을 작업에 맞게 정제하는 'Query-specific Refinement' 기법이 에이전트의 성공률을 유의미하게 회복할 수 있음을 입증하여 실무 에이전트 설계의 방향성을 제시한다.
현재 비디오-언어 모델(VLM)의 성능 향상이 실제 시각 이해가 아닌 언어적 편향에 의존하고 있다는 충격적인 사실을 폭로한다. 데이터 큐레이션만으로 복잡한 알고리즘보다 더 큰 성능 향상을 이룰 수 있음을 증명하여 VLM 연구의 새로운 방향성을 제시한다.
기존의 가상 시착 기술은 정지 이미지에 국한되거나 비디오 생성 시 인물의 정체성이 변하는 문제가 있었다. 이 논문은 단일 단계 통합 프레임워크를 통해 의류 전송과 동작 애니메이션을 동시에 수행함으로써 시각적 일관성과 실시간성을 크게 개선했다.
LLM이 외부 도구를 사용하는 과정에서 발생하는 KV-Cache 축출과 긴 응답 데이터는 기존의 토큰 수 기반 지표로는 측정할 수 없는 막대한 하드웨어 비용을 초래한다. 이 논문은 하드웨어 특성을 반영한 새로운 효율성 지표 PTE를 통해 도구 사용 시 발생하는 비효율적 패턴을 정량화하고, 단순히 도구를 많이 쓰는 것이 정답률 향상으로 이어지지 않음을 입증했다.
기존의 LLM 자기 개선 방식은 별도의 피드백 데이터나 강력한 스승 모델의 교정이 필요했지만, 이 논문은 정답 여부만으로 추론과 검토 능력을 동시에 학습시키는 효율적인 프레임워크를 제시했다. 특히 어려운 수학 문제에서 모델 스스로 오류를 수정하는 능력을 극대화하여 실제 문제 해결 성능을 대폭 향상시켰다.
코드 생성이나 수정과 달리, 실행 중인 환경에서 스스로 문제를 정의하고 찾아내는 자율 버그 발견은 AI 소프트웨어 엔지니어링의 마지막 난제로 꼽힌다. 이 논문은 동적인 게임 환경을 활용해 LLM이 복잡한 상태 변화 속에서 논리적 결함을 찾아낼 수 있는지 측정하는 표준화된 시험대를 제공한다.
LLM이 생성한 코드를 검증하기 위해 LLM이 생성한 테스트를 사용하면 테스트 자체가 틀릴 수 있다는 순환 참조 문제가 발생한다. 이 논문은 정답을 모르는 상태에서도 오직 테스트들 사이의 일관성만을 분석하여 신뢰할 수 있는 테스트에 더 높은 가중치를 주는 수학적 방법론을 제시하여 코드 선택의 정확도를 높였다.
기존 검색 모델은 인간의 클릭 로그에 의존해 학습되었으나, AI 에이전트는 인간과 다른 방식으로 정보를 소비하여 성능 병목이 발생한다. 이 논문은 에이전트가 스스로 생성한 실행 궤적을 학습 데이터로 활용해 에이전트 환경에 최적화된 검색 모델을 만드는 새로운 패러다임을 제시한다.
기존 비디오 이해 벤치마크들이 포화 상태에 이르러 모델의 실제 성능을 왜곡하는 문제를 해결하기 위해 설계됐다. 단순 정답률 측정을 넘어 논리적 일관성과 단계별 추론 능력을 엄격하게 평가함으로써 차세대 비디오 멀티모달 모델 개발을 위한 새로운 기준점을 제시한다.
미국 항소법원이 Anthropic에 대한 국방부의 공급망 위험 지정을 유지하기로 판결하며, AI 기업의 자율적 사용 제한 정책과 국가 안보 논리가 충돌하고 있다.
Claude Code의 ultraplan 기능을 대신하여 Claude Web의 확장 추론 기능을 활용해 코딩 계획의 오류를 수정하고 실행하는 워크플로를 제안한다.
Claude Code를 동일 저장소에서 여러 세션으로 실행할 때 발생하는 파일 충돌과 병합 문제를 자동화된 워크트리 관리로 해결해주는 도구 ruah가 공개됐다.
그리스 공무원이 개발한 행정 문서 처리 AI 포털이 고위 관료의 무관심을 극복하고 OECD 공공 부문 혁신 관측소(OPSI)의 2026년 혁신 사례 후보로 제출되었다.
AI 스킨케어 생성기가 기술적 정확성에도 불구하고 사용자 의도(단순화)를 반영하지 못하는 설계적 한계와 UI 결함으로 인해 겪은 실무적 문제점을 다룹니다.
Tauri와 Vite로 구축된 이 macOS 트레이 도구는 클립보드를 감시하여 에러 로그의 불필요한 공백과 반복되는 헤더를 자동으로 제거한다.
Anthropic의 프로그래밍 방식 도구 호출 기법을 활용하여 토큰 비용을 절감하고 MCP 도구의 출력 스키마를 지원하는 오픈소스 프로젝트를 공유했다.
프롬프트 기반의 에이전트 구현 방식이 가진 취약성을 지적하며, 모델 내부에 에이전트 구조를 통합한 차세대 아키텍처로의 전환 필요성을 논의한다.
LLM의 환각 문제를 해결하기 위해 초기 생성, 자기 비판, 재작성 단계로 구성된 검증 사슬(CoV) 루프를 구축하여 시장 조사 정확도를 높인 사례이다.
LLMLingua 시리즈는 LLM의 중복된 자연어 특성을 이용해 프롬프트를 최대 20배 압축하며 비용과 성능을 동시에 최적화한다.
사용자가 작성한 원본 프롬프트와 AI가 모호성을 해소하여 스스로 재작성한 프롬프트를 비교하여 숨겨진 정보와 포맷 차이를 분석하는 실험이다.
AWS CEO 맷 가먼은 OpenAI와 Anthropic에 대한 동시 투자가 클라우드 사업의 본질적인 경쟁 구조이며, 모델 라우팅을 통해 이를 해결할 것이라고 밝혔다.
에이전트의 하네스를 평가 데이터와 대조하며 반복적으로 개선하여 일반화 성능을 높이는 Better-Harness 시스템과 방법론을 제시한다.
헬스케어 분야의 규제 준수와 환자 안전을 위해 AWS 서비스와 MCP를 활용한 4가지 인간 참여형(HITL) 에이전트 승인 워크플로 구현 방식을 제시한다.
Amazon Bedrock에서 제공하는 SFT, RFT, 증류 기법을 통해 Amazon Nova 모델을 저비용으로 비즈니스 특화 작업에 최적화하는 방법과 실무 팁을 제시한다.
Meta Tech 팟캐스트에서 대규모 인프라의 설정 배포 안전성을 높이기 위한 카나리 배포, 모니터링, 그리고 AI 기반의 장애 대응 최적화 전략을 공유했다.
PDF 내 특정 키워드와 관련된 인용 문헌을 자동으로 찾아 계보를 시각화해주는 오픈소스 도구 Citracer가 공개됐다.
40년 경력의 개발자가 Claude와 신뢰 관계를 구축하기 위해 프레임워크 없이 1,400줄의 Python으로 독립된 대화 환경을 구축하고 그 변화를 관찰했다.
AI 에이전트가 도구를 직접 호출하는 대신 '제안-승인-실행' 단계를 거쳐 예산 범위 내에서만 작동하도록 제한하는 실행 시점 권한 부여 아키텍처가 제안됐다.
도심의 복잡한 환경에서 LiDAR 인식 성능 저하를 해결하기 위해 시나리오 중심의 데이터 확장과 정밀한 멀티 센서 정렬 및 시계열 라벨링 전략이 필수적이다.
Microsoft Power Automate의 로우코드 환경에서 Databricks SQL 쿼리와 작업을 직접 트리거하여 거버넌스가 확보된 데이터 워크플로를 구축하는 방법을 다룹니다.
아마존은 멀티 에이전트 AI 시스템인 RuleForge를 통해 보안 취약점 탐지 규칙 생성 속도를 336% 가속화하고 오탐률을 67% 줄였습니다.
LLM-Kasten은 AI 에이전트가 프로젝트 지식을 효율적으로 검색하고 활용할 수 있도록 돕는 CLI 기반의 제텔카스텐 지식 관리 시스템입니다.
Anthropic이 보안 취약점을 자율적으로 찾아내고 악용할 수 있는 고성능 AI 모델 'Claude Mythos Preview'의 공개를 안전상의 이유로 보류했다.
Databricks 공동 창립자 마테이 자하리아가 ACM 컴퓨팅 상을 수상하며, AI를 인간의 기준이 아닌 고유의 강점에 집중해 발전시켜야 한다는 견해를 밝혔다.
OpenAI가 AI를 악용한 아동 성착취 및 학대물 생성에 대응하기 위해 법률 업데이트와 시스템 보호 장치 강화를 골자로 하는 '아동 안전 청사진'을 발표했다.
IBM이 자사의 최신 AI 하드웨어인 Spyre 가속기의 상세 기술 사양과 아키텍처를 기술 노트를 통해 공개했다.
IBM이 자사의 최신 AI 하드웨어인 Spyre 가속기의 기술적 세부 사양과 아키텍처를 공개했다.
인텔과 삼바노바가 GPU, RDU, Xeon 6 프로세서를 결합하여 에이전트형 AI의 추론 성능과 효율을 극대화하는 새로운 이종 컴퓨팅 블루프린트를 공개했다.
AI 학습에 투입되는 컴퓨팅 자원이 하드웨어와 소프트웨어의 혁신을 통해 기하급수적으로 증가하며 인간 수준의 에이전트 시대를 열고 있다.
시스템 프롬프트가 없는 로우 API 상태의 LLM이 텍스트 주입을 통해 자아를 묘사하고 특정 실패 패턴을 보이는 현상을 실험했다.
ElevenLabs Creative의 Kling 모션 컨트롤과 Voice Changer 기능을 활용하여 영상 속 인물의 움직임과 연기 톤을 유지한 채 외형과 목소리만 교체하는 실전 워크플로를 다룹니다.
Airbnb 게스트의 불편함을 해결하기 위해 개발된, 자연어 의도 파악과 로컬 실행을 지원하는 유연한 AI 비서 플랫폼 Project Athena를 소개한다.