AI가 운영체제 전체를 코딩했다? 100% AI 생성 유닉스 클론 등장
AI가 생성한 코드만으로 ext2, SMP, USB 스택 등을 지원하는 유닉스 클론 운영체제를 구축한 사례이다.
총 100건
AI가 생성한 코드만으로 ext2, SMP, USB 스택 등을 지원하는 유닉스 클론 운영체제를 구축한 사례이다.
복잡한 문서 구조를 유지하며 PDF, PPTX 등 다양한 형식을 처리하는 오픈소스 RAG 전처리 도구 RAG-Anything이 공개됐다.
서로 다른 추론 스타일을 가진 두 교사 모델로부터 지식을 증류한 뒤, 어휘 레이어 고정 및 그래디언트 보간법을 적용한 SLERP 병합으로 소형 모델의 추론 성능을 시너지 효과 수준으로 끌어올린 연구입니다.
Claude Code를 활용해 iOS의 센서 권한 및 타이머 스로틀링 문제를 해결하며 구축한 식당 추천 PWA 프로젝트 공유이다.
56개의 모델 설정과 자동 논문용 결과 생성 기능을 갖춘 3D 포인트 클라우드 딥러닝 통합 프레임워크 LIDARLearn이 공개됐다.
기존의 루브릭 기반 검증 방식은 사람이 직접 작성한 고비용의 가이드라인이 필요했으나, C2는 이진 선호도 데이터만으로 유용한 루브릭을 자동 생성하고 검증합니다. 이를 통해 보상 모델이 스스로 판단 기준을 세우고 오류를 걸러내는 협력적 구조를 구축하여 모델의 신뢰성을 높입니다.
이 논문은 전기 공학의 3상 교류 시스템 개념을 Transformer 아키텍처에 도입하여 학습 효율성을 극대화하는 방법을 제안한다. 추가 파라미터가 거의 없음에도 불구하고 WikiText-103 벤치마크에서 기존 RoPE 기반 모델보다 1.93배 빠른 수렴 속도와 7.2%의 Perplexity 개선을 달성하여 대규모 언어 모델의 학습 비용 절감 가능성을 보여준다.
AI 에이전트의 셸 명령 실행 과정을 tmux 세션에서 실시간으로 확인하고 터미널 출력을 직접 전달할 수 있는 tmux-mcp 도구가 공개됐다.
자체 구축한 조직 기억 벤치마크(OMB) 테스트 결과, Claude Opus 4.7이 이전 버전인 4.6보다 추론 및 모순 탐지 성능이 낮게 나타났다.
Anthropic이 성능이 개선된 Claude Opus 4.7을 발표했으나, 정작 최강 모델인 Mythos Preview는 일반 공개를 거부하며 AI 산업의 비민주적 전환을 시사했다.
Amazon Bedrock이 IAM 주체별로 추론 비용을 자동 추적하고 태그를 통해 팀·프로젝트별 비용 분석을 지원하는 세분화된 비용 할당 기능을 발표했습니다.
Vessel Browser는 인간의 개입과 시각적 모니터링을 지원하면서 자율 에이전트의 웹 탐색 효율을 극대화하도록 설계된 오픈소스 브라우저입니다.
ServiceNow CEO 빌 맥더멋이 AI 시대의 리더십, 기업용 소프트웨어의 변화, 그리고 AI 에이전트가 노동 시장에 미칠 영향에 대해 논의했다.
저사양 Intel NUC 환경에서 스왑 파일과 디스크 버퍼링 기법을 활용해 Gemma 모델을 GGUF로 변환하고 특정 도메인 데이터를 주입하여 Ollama로 배포하는 데 성공했다.
젠슨 황 엔비디아 CEO는 앤스로픽이 구글 TPU 성장의 주역이며, 엔비디아는 공급망 장악을 통해 시장 지배력을 유지한다고 밝혔다.
OpenAI가 IPO를 앞두고 제품 전략을 단순화하기 위해 Sora 앱을 중단하고 과학 연구팀을 해체하며 주요 경영진들이 잇따라 퇴사하고 있다.
Amazon Nova 멀티모달 임베딩과 하이브리드 검색 아키텍처를 결합하여 비디오의 시각, 오디오, 텍스트 신호를 통합 분석하는 고성능 검색 솔루션을 구축합니다.
프롬프트 조작을 통해 모델의 추론 과정을 CoT에서 응답 영역으로 옮김으로써 스타일 제어력을 높이고 감시를 회피할 수 있음이 확인됐다.
서바이버 데이터를 활용해 RAG와 GraphRAG를 비교한 결과, 복합 질의 해결에는 에이전트 루프를 통한 반복적 검증 구조가 가장 효과적임이 확인됐다.
AI 코딩 스타트업 Cursor가 500억 달러의 기업 가치를 인정받으며 Nvidia와 Thrive 등이 참여하는 20억 달러 규모의 신규 투자 유치를 앞두고 있다.
AI 코딩 에이전트의 발전으로 코드 이해 없이 개발하는 '바이브 코딩'이 확산되고 있으나, 이는 비용 최적화 실패와 플랫폼 의존성 심화라는 새로운 문제를 야기하고 있다.
AI 코딩 도구 도입으로 코드 생산량은 늘었으나, 품질 저하로 인한 재수정 작업(Code Churn)이 급증하며 실질적 생산성 효율에 의문이 제기되고 있다.
포에트리 카메라는 촬영된 장면을 AI로 분석하여 영수증 용지에 시를 출력하는 독특한 가젯이지만, 기술적 한계와 AI 창작물의 깊이 부족이라는 과제를 안고 있다.
Sam Altman의 World 프로젝트가 Tinder와 글로벌 파트너십을 맺고 AI 에이전트 범람에 대비한 홍채 인식 기반 인간 인증 서비스를 확대합니다.
Lindy AI를 활용해 주당 600통의 이메일을 자동 처리하던 직원이 업무 아웃소싱 의혹으로 해고 위기에 처했다가 오히려 전사 교육을 맡게 된 사례이다.
Databricks의 Zerobus와 Lakebase를 사용하여 복잡한 Kafka 클러스터 없이 전 세계 수만 개의 IoT 센서 데이터를 수 밀리초 지연 시간으로 수집, 처리 및 시각화하는 아키텍처를 소개한다.
오픈소스 AI 에이전트 프로젝트인 OpenClaw의 유지 관리자가 5개월간의 폭발적 성장 과정과 커뮤니티 관리 및 보안 측면의 실무 경험을 공유한다.
메타가 AI 인프라 구축을 위한 대규모 투자로 메모리 칩 등 핵심 부품 가격 상승을 초래하며 퀘스트 VR 헤드셋 가격을 50~100달러 인상했다.
Claude Opus 4.7과 4.6 모델을 동일한 프롬프트로 4가지 실무 벤치마크를 통해 비교하여 4.7 모델의 향상된 지시 이행 능력과 디테일한 결과물 생성 성능을 확인했다.
NVIDIA가 1,200만 개의 합성 데이터를 활용해 한국어, 일본어 등 다국어 환경에서 높은 정확도와 초당 34.7페이지의 빠른 처리 속도를 구현한 Nemotron OCR v2를 공개했습니다.
LangChain의 슬라이딩 윈도우 메모리 한계를 해결하기 위해 그래프 구조와 야간 압축 기능을 갖춘 오픈소스 로컬 메모리 라이브러리 agent-memory-core가 공개됐다.
카네기 멜론 대학교(CMU) 연구팀이 AI를 활용해 복잡한 물리적 기술을 실시간으로 교육하는 ARISTOS 프로젝트로 문샷 AI 경진대회에서 우승했다.
Springdrift 시스템의 에이전트가 구성 오류로 인한 기능 부재를 스스로 인지하고 인지 사이클을 통해 대안을 찾아 실행한 사례를 공유했다.
OpenClaw AI 에이전트를 GitHub와 연동하여 코드 분석부터 기능 구현, 풀 리퀘스트 생성까지의 전 과정을 자동화하는 실전 튜토리얼이다.
단일 채팅창에서 53개의 도구를 효율적으로 관리하기 위해 사용자 의도에 따라 도구 노출 범위를 동적으로 조절하는 'Attention Scoping' 패턴을 제안했다.
AITrigram은 쿠버네티스 환경에서 LLM 모델 관리, vLLM/Ollama 추론 서빙, LoRA 파인튜닝 루프를 자동화하는 오픈소스 오퍼레이터이다.
신발 브랜드 Allbirds의 AI 기업 전환 선언과 Stanford의 AI 지표 보고서를 통해 AI 기술에 대한 대중의 피로감과 산업적 거품 현상을 진단한다.
수학적 추론 능력을 높이기 위해 다양한 프롬프트 전략을 섞는 시도가 실제로는 효과가 미미하거나 오히려 성능을 떨어뜨릴 수 있음을 증명했습니다. 높은 온도의 샘플링이 이미 충분한 다양성을 제공하므로, 복잡한 프롬프트 기법보다 더 큰 모델을 사용하고 단순한 다수결 투표를 반복하는 것이 효율적이라는 실무적 통찰을 제공합니다.
데이터가 실시간으로 들어오는 온라인 학습 환경에서는 새로운 정보를 배울 때 과거의 지식을 잊어버리는 파멸적 망각 문제가 심각하다. 이 논문은 최적 운송 이론을 활용해 데이터의 복잡한 분포 변화를 실시간으로 추적하고 보존함으로써, 추가 학습 시에도 과거 모델의 성능을 안정적으로 유지하는 새로운 프레임워크를 제시한다.
생물학 분야에서 LLM의 활용은 사실에 근거한 실행 가능한 설명이 부족하다는 한계가 있었다. 이 논문은 생물학적 추론을 구조화된 액션 그래프로 정형화하고, 멀티 에이전트 프레임워크인 VCR-Agent를 통해 검증 가능한 메커니즘 추론을 자동화함으로써 신약 개발 및 세포 반응 예측의 신뢰성을 높인다.
기존의 행동 규제 강화학습은 복잡한 정책 파라미터화나 보수적인 샘플링에 의존해 대규모 생성 모델로 확장하기 어려웠다. 이 논문은 최적 운송 이론을 도입해 가치 함수의 그래디언트만으로 정책을 유연하게 조정함으로써, 오프라인 RL과 LLM 정렬에서 SOTA 성능을 달성하고 테스트 시점의 적응형 스케일링까지 가능하게 한다.
기존의 AI 기반 웹페이지 생성 도구들은 텍스트와 코드는 잘 다루지만 이미지, 비디오, 차트와 같은 멀티모달 요소를 전체 디자인 맥락에 맞춰 통합하는 데 한계가 있었다. 이 논문은 계층적 계획과 반복적인 자기 반성 메커니즘을 통해 시각적으로 일관되고 구조적으로 완성도 높은 웹페이지를 생성하는 에이전트 프레임워크를 제시하여 UI/UX 자동화의 수준을 높였다.
기존 AI 에이전트 메모리는 데이터를 단순히 벡터 데이터베이스에 저장만 할 뿐, 인간처럼 중요하지 않은 정보를 잊거나 지식을 요약하여 내재화하는 능력이 부족했다. 이 논문은 로컬 환경에서 작동하며 생물학적 망각 곡선과 다단계 양자화 기법을 도입해 메모리 효율성과 검색 정확도를 동시에 개선하는 새로운 아키텍처를 제시한다.
이미지 생성 AI가 단순히 물체를 배치하는 수준을 넘어, 인간과 사물 사이의 복잡한 물리적 상호작용(HOI)을 정확하게 이해하고 수정할 수 있게 한다. 기존 모델들이 해결하지 못한 다중 상호작용 편집과 정교한 자세 제어를 하나의 통합된 프레임워크로 구현하여 AR/VR 및 콘텐츠 제작의 수준을 높인다.
서로 다른 토크나이저를 사용하는 모델 간의 지식 증류는 어휘 사전 불일치 문제로 인해 매우 까다로운 과제였다. 이 논문은 모든 토크나이저의 공통 분모인 바이트 레벨에서 증류를 수행하는 단순하고 효과적인 방법론을 제시하여, 도메인 특화 모델 학습이나 이종 모델 간의 지식 융합 가능성을 열어준다.
RAG 시스템에서 동일한 문서를 여러 번 참조할 때마다 발생하는 중복 계산 문제를 해결합니다. 기존 방식과 달리 모델 수정이나 재계산 없이도 미리 저장된 캐시를 즉시 결합할 수 있어 추론 속도를 획기적으로 높이고 비용을 절감합니다.
기존의 이미지 생성 모델 정렬 방식은 메모리 한계로 인해 이미지의 전체 구도를 결정하는 초기 생성 단계를 직접 수정하기 어려웠다. 이 논문은 긴 생성 과정을 단 2단계의 '도약(Leap)'으로 압축하여 모든 단계에서 효율적으로 학습할 수 있는 방법을 제시함으로써 이미지 품질과 텍스트 일치도를 동시에 개선했다.
긴 문맥을 처리할 때 LLM 내부의 모든 파라미터를 업데이트하는 대신, 추론에 결정적인 역할을 하는 고유한 활성화 패턴에 집중하여 학습 효율과 성능을 동시에 잡았습니다. 이는 긴 문서 이해와 복잡한 추론이 필요한 AI 에이전트 개발에 있어 자원 소모를 줄이면서도 정확도를 높일 수 있는 새로운 방향을 제시합니다.
기존 RAG 시스템은 LLM을 검색 결과의 수동적인 소비자로 취급하여 전체 지식 구조를 파악하지 못하는 한계가 있다. 이 논문은 지식 베이스를 계층적인 '스킬 디렉토리'로 변환하여 에이전트가 스스로 탐색하고 추론하며 정보를 찾게 함으로써 복잡한 질의에 대한 답변 정확도를 획기적으로 높였다.
기존의 의료 AI 모델은 판독 결과만 제공하는 '블랙박스' 형태여서 임상 현장에서의 신뢰도가 낮았다. 이 논문은 AI가 어떤 도구를 사용하여 어떤 근거로 결론에 도달했는지 단계별 추론 과정을 시각화함으로써 의료진이 검증 가능한 투명한 진단 시스템을 구축했다.
기존의 Text-to-3D 모델은 프롬프트가 학습 데이터 분포를 벗어나면 형상이 변하지 않는 '싱크 트랩' 현상을 겪습니다. 이 논문은 텍스트 가이드 없이 모델의 무조건부 생성 능력을 활용해 복잡하고 정교한 3D 형상을 복원하고 편집하는 새로운 프레임워크를 제시합니다.
멀티모달 대형 언어 모델(MLLM)이 시각 정보보다 텍스트 패턴에 의존하는 '언어 편향' 문제를 해결하기 위한 연구이다. 별도의 인간 주석 없이도 모델이 이미지의 세부 특징에 강제로 집중하게 만드는 자가 지도 학습 과제를 도입하여 시각적 추론 성능을 개선했다.
이 논문은 Anthropic의 상용 코딩 에이전트인 Claude Code의 내부 구조를 소스 코드 수준에서 분석하여 실제 프로덕션 에이전트가 어떻게 설계되는지 보여준다. 단순한 모델 호출을 넘어 안전성, 컨텍스트 관리, 확장성을 위한 복잡한 시스템 계층이 자율적 코딩 작업의 핵심임을 입증한다.
LLM을 분류 작업에 사용할 때 발생하는 높은 비용 문제를 해결하기 위해, 실제 운영 로그(Trace)를 활용해 가벼운 대체 모델(Surrogate)을 자동으로 학습시키고 배포하는 시스템을 제안한다. 개발자가 수동으로 데이터를 라벨링할 필요 없이 운영 과정에서 스스로 성능을 개선하는 플라이휠 구조를 갖추고 있어 실무적인 가치가 매우 높다.
대형 시각-언어 모델(VLM)을 모바일이나 엣지 기기에 배포하기 위해서는 모델 경량화가 필수적이다. 이 논문은 시각 정보를 언어 모델의 경로로 직접 전달하는 새로운 증류 방식을 통해, 구조 변경 없이도 소형 모델의 멀티모달 이해 능력을 획기적으로 개선했다.
기존 시각적 RAG 시스템은 문서 내의 복잡한 시각적 세부 사항을 놓치거나 불필요한 배경 노이즈를 포함하는 한계가 있었다. UniDoc-RL은 검색부터 세부 영역 크롭까지의 과정을 계층적 액션으로 정의하고 강화학습으로 최적화하여, 모델이 정보가 밀집된 핵심 영역에만 집중하도록 유도함으로써 추론 정확도를 획기적으로 높였다.
기존의 3D 가우시안 스플래팅 방식은 입력 이미지가 늘어날수록 데이터 크기가 비대해지고 연산 속도가 느려지는 한계가 있었다. 이 논문은 전역 장면 토큰 방식을 도입하여 입력 뷰의 개수와 상관없이 일정한 수의 가우시안만으로 고품질 3D 장면을 재구성함으로써, 모바일 기기 등 저사양 환경에서도 실시간 3D 렌더링이 가능한 길을 열었다.
기존의 통합형 로봇 모델은 미세한 제어 학습 과정에서 고차원적인 추론 능력을 상실하는 고질적인 문제가 있었다. 이 논문은 시각적 접지(Visual Grounding)를 매개로 계획과 실행을 분리하여, 복잡한 환경에서도 로봇이 정확하게 물체를 식별하고 조작할 수 있는 새로운 표준을 제시한다.
최신 LLM들이 과거 시제로 질문을 바꾸는 간단한 변형만으로도 안전 가이드라인이 무력화되는 취약점을 해결한다. 모델의 전체 성능을 떨어뜨리지 않으면서도 특정 보안 구멍만 정밀하게 수리하는 기계론적 접근법을 제시한다.
강력한 모델이 생성한 데이터를 작은 모델에 학습시키는 기존 방식은 추론 모델의 고유한 스타일과 충돌하여 성능을 떨어뜨리는 문제가 있었다. 이 논문은 교사 모델의 지식과 학생 모델의 스타일을 결합하는 새로운 합성 방식을 통해 추론 모델의 성능을 효과적으로 높이는 방법을 제시한다.
기존 AI 연구 에이전트 평가는 실시간 웹 검색에 의존하여 결과가 매번 달라지는 재현성 문제가 있었다. 이 논문은 실제 사용자의 멀티모달 파일을 포함한 통제된 샌드박스 환경을 구축하여, 에이전트의 정보 검색과 보고서 작성 능력을 정밀하고 객관적으로 측정할 수 있는 벤치마크를 제공한다.
기존의 확산 모델 기반 자율주행 플래너는 모방 학습만으로는 폐쇄 루프 환경에서의 불안정성과 피드백 부족 문제를 겪었습니다. RAD-2는 생성자와 판별자를 분리하여 고차원의 궤적 최적화 문제를 저차원의 보상 신호와 연결함으로써 학습 안정성을 획기적으로 높이고 실제 주행 안전성을 크게 개선했습니다.
기존 3D 생성 기술은 화질이 낮거나 물리적 구조가 부정확한 한계가 있었다. HY-World 2.0은 텍스트나 이미지 한 장으로 실제 게임처럼 내부를 돌아다닐 수 있는 정교한 3D 공간을 자동으로 만들어내며, 오픈소스 중 세계 최고 수준의 성능을 달성했다.
LiteLLM의 스트리밍 지연 문제를 해결하기 위해 Go 기반 프록시인 Bifrost로 전환하여 성능을 개선하고 상세 로깅을 통해 비효율적인 비용 지출을 발견한 사례이다.
CrewAI의 멀티 에이전트 아키텍처를 통해 일일 5만 건의 주문을 처리하는 이커머스 기업의 반품 프로세스를 자동화하여 비용을 60% 절감한 사례이다.
Allen Institute for AI(AI2)의 새로운 벤치마크 결과, 기존 AI 모델들이 실제 과학적 과업 수행에서 인간 전문가 대비 현저히 낮은 성능을 보였다.
Dwarkesh Patel이 지식 증류를 통한 모델 복제 가속화, GPT-4의 초기 학습 버그, GPU 스케일링의 물리적 한계 등 AI 업계의 핵심 쟁점을 분석했다.
OpenAI가 Agents SDK를 활용해 격리된 샌드박스 환경에서 코드베이스를 조각별로 안전하게 마이그레이션하는 아키텍처와 워크플로를 공개했다.
Anthropic이 Claude의 사용량 초기화 방식을 개별 롤링 타이머에서 전역 고정 시간제로 변경하여 다중 계정 순환 사용을 차단했다.
한 달간 6개의 프로젝트를 완수한 개발자가 AI 시대의 핵심 역량으로 적재적소의 모델 선택과 빌드 타임 AI 활용 능력을 제시했다.
보안 분석을 위해 여러 전문 에이전트를 병렬로 실행하고 리드 에이전트가 결과를 종합하는 멀티 에이전트 시스템 ShipSafe를 구축했다.
에이전트가 생성한 코드의 구조적 결함을 C4 다이어그램 시각화와 비전 모델 분석을 통해 자동으로 검토하는 Synopsis 도구가 공개됐다.
Claude Code 에이전트가 생성한 마크다운 파일을 모바일 브라우저에서 HTML로 렌더링하여 읽을 수 있게 해주는 경량 Python 서버 도구이다.
Claude Code에서 MCP와 스킬 라이브러리 사용 시 발생하는 시스템 리마인더 토큰 비용을 줄이기 위한 문서 구조화 전략을 제시한다.
Amazon Bedrock의 모델 증류 기능을 활용해 거대 모델의 검색 의도 파악 능력을 소형 모델로 전이함으로써 비디오 검색 시스템의 비용과 지연 시간을 획기적으로 개선했다.
AI의 범위 누락과 할루시네이션을 방지하기 위해 4개 위원회와 13개 품질 게이트를 갖춘 Claude Code 전용 SDLC 프레임워크가 공개되었습니다.
Claude 4.7은 원본 추론 과정을 보조 모델을 통해 요약하여 전달함으로써 개발자의 가독성을 높이고 컨텍스트 효율을 개선했다.
Claude 4.7의 기본 노력 수준이 'xhigh'로 변경되면서 깊은 추론이 가능해졌으나, 불필요한 파일 탐색 단계에서의 토큰 소모가 급증하는 부작용이 발생했다.
Nova Forge SDK의 데이터 믹싱 기능을 활용해 모델의 일반 지능을 유지하면서 도메인 특화 성능을 높이는 파인튜닝 워크플로를 상세히 설명한다.
위성 이미지 분석 결과, 인력 부족과 전력 공급 문제로 인해 미국 내 AI 데이터 센터 프로젝트의 약 40%가 올해 완공 일정을 맞추지 못할 것으로 나타났다.
Claude Code와 같은 AI 에이전트의 토큰 사용량, 도구 호출 지연 시간, 컨텍스트 증가량을 로컬에서 실시간 모니터링하는 오픈소스 도구 Anjor가 공개됐다.
AWS 마케팅 팀이 Amazon Bedrock과 Gradial의 에이전트형 AI를 도입하여 웹 페이지 조립 시간을 4시간에서 10분으로 단축하고 실시간 품질 검증을 자동화했다.
Google Gemini API 설정에 service_tier: 'flex'를 추가하여 응답 지연을 감수하는 대신 비용을 50% 절감할 수 있다.
Claude Code를 사용하여 주요 보안 피드를 감시하고 실제 익스플로잇 가능성을 점수화하여 알림을 주는 보안 도구 구축 사례이다.
NVIDIA L4 GPU와 TPU v5e를 대상으로 배치 크기, 시퀀스 길이 등 6가지 변수를 통제 실험한 결과, 대규모 배치와 긴 시퀀스에서 TPU가 압도적인 가성비를 보임을 확인했다.
테크 기자들이 Claude와 ChatGPT를 활용해 기사 초안을 작성하고 대량 생산하는 실태와 이에 따른 저널리즘의 인간적 가치 상실에 대한 우려를 다룬다.
Claude Code 에이전트의 실행 세션을 포켓몬 캐릭터와 게임 인터페이스로 시각화하여 관리하는 오픈소스 대시보드 프로젝트이다.
Tauri 2와 React를 기반으로 세션 지속성 및 멀티 프로젝트 탭 기능을 갖춘 Claude Code 전용 GUI 도구 Orbit이 공개됐다.
AI 서비스 제공업체들이 모호하게 운영하는 사용량 제한(Usage Limits)을 구체적인 수치로 공개하고 실시간 대시보드를 제공하도록 의무화하자는 제안이다.
데어리 퀸이 서비스 속도 향상과 추가 판매 유도를 위해 미국 및 캐나다 수십 개 드라이브스루 매장에 Presto의 AI 챗봇을 도입한다.
로보틱스 및 SLAM 응용 분야에서 롤링 셔터 카메라가 유발하는 기하학적 왜곡의 원인을 분석하고, 이를 보정하기 위한 이산 및 연속 모션 모델링 기법을 제시합니다.
자율 AI 에이전트의 유연성과 결정론적 워크플로우의 일관성을 결합하여 업무 자동화의 품질을 보장하는 오픈소스 플랫폼 BlueKiwi를 소개합니다.
Anthropic이 텍스트 설명만으로 앱 프로토타입, 슬라이드 등 시각적 결과물을 생성하고 편집할 수 있는 실험적 도구 'Claude Design'을 발표했다.
작성자가 집중력 향상을 위해 Claude와 GPT-4o-mini를 활용하여 3주 만에 구축한 개인용 뇌 훈련 앱 개발 경험과 기술 스택을 공유했다.
전기 공학의 3상 전력 기하학(120도 위상차)을 Transformer 아키텍처에 도입하여 학습 속도를 1.93배 높이고 성능을 개선한 연구이다.
Claude Code에 OS 루트 권한을 부여해 정밀 보안 스캔을 수행한 결과, 악성코드는 없었으나 환경 변수에 노출된 실시간 API 키들을 발견하여 조치했다.
Anthropic Managed Agents API의 한계를 보완하여 예약 실행, 버전 관리, 다중 사용자 인증을 지원하는 SvelteKit 기반 오픈소스 대시보드이다.
Opus 4.7의 토크나이저 변경으로 인한 비용 상승에 대응하여 9,667개 세션을 분석하고 프롬프트 캐싱 및 훅을 활용한 실무적 비용 절감 방안을 제시했다.