AI 이미지 생성하던 Midjourney가 초음파 전신 스캐너를 만든 이유
Midjourney가 Butterfly Network와 협력하여 초음파 기반 전신 스캐너를 개발하고, 2027년 샌프란시스코 스파에서 서비스를 시작한다.
총 100건
Midjourney가 Butterfly Network와 협력하여 초음파 기반 전신 스캐너를 개발하고, 2027년 샌프란시스코 스파에서 서비스를 시작한다.
GenDB는 LLM 에이전트를 사용하여 데이터와 워크로드에 최적화된 네이티브 쿼리 실행 코드를 생성하는 생성형 쿼리 엔진이다.
LMSYS Arena의 LLM 랭킹과 OpenRouter의 실시간 가격 정보를 결합하여, 최적의 모델을 찾고 신규 모델 출시 시 알림을 받을 수 있는 추적 서비스입니다.
AI 인프라로 전환하는 기업들의 전략과 MCP 출시, 그리고 AI에 대한 대중의 인식을 다룹니다.
쇼핑 에이전트 답변 모델 개발 시 스펙 변경에 대응하여 결함 탐지, 프롬프트 최적화, SFT 데이터 생성을 자동화하는 파이프라인 구축 경험 공유.
Diffusion과 Flow Matching의 수식과 샘플링 과정을 비교하여 생성 모델의 작동 원리와 궤적 차이를 분석한다.
Amazon Quick은 자율 에이전트와 통합 데이터 분석 기능을 통해 다양한 앱과 데이터 소스를 연결하고 반복 업무를 자동화하여 생산성을 높이는 AI 어시스턴트입니다.
Amazon SageMaker AI Async Inference가 최대 128,000바이트의 인라인 페이로드 전송을 지원하여 S3 업로드 과정 없이 추론 요청이 가능해졌다.
Claude Code의 세션 시작 시 발생하는 MCP 서버와 컨텍스트 오버헤드를 식별하고, Opik을 통해 조직 단위로 비용을 관리하여 최대 40%까지 절감하는 전략.
Databricks와 NVIDIA가 협력을 강화하여 AI Runtime, Model Serving, Vera CPU 기반의 엔드투엔드 AI 플랫폼을 구축한다.
NVIDIA GEAR 연구소가 AI 에이전트가 로봇 학습 과정을 스스로 설계하고 실행하여 복잡한 물리적 작업을 자동화하는 프레임워크 ENPIRE를 개발했다.
Fimo는 아이디어 설명만으로 콘텐츠와 디자인이 포함된 다중 페이지 웹사이트를 생성하는 AI 웹사이트 빌더입니다.
Salesforce Headless 360은 UI를 분리하고 AI 에이전트가 기존 Salesforce 보안 정책을 상속받아 안전하게 데이터를 처리하도록 지원한다.
RF-DETR Keypoint는 확률적 손실 함수와 NAS를 활용해 실시간으로 고정밀 키포인트 검출을 수행하는 엔드투엔드 모델이다.
iPhone에 탑재된 Apple Intelligence의 글쓰기 도구, 시각 지능, 실시간 번역, 이미지 생성 및 ChatGPT 연동 기능을 상세히 설명한다.
Radical AI는 AI 과학자와 자동화 로봇을 결합한 자율 주행 실험실(SDL)을 통해 소재 발견 속도를 기존 대비 10배 이상 가속화하고 있다.
Pew Research 조사 결과, 미국인의 AI 사용은 증가하고 있으나 AI의 장기적 영향에 대한 사회적 인식은 여전히 부정적이고 회의적인 것으로 나타났다.
자율주행 기술 기반의 월드 모델 스타트업 Odyssey가 아마존 등의 투자를 받아 14.5억 달러 기업 가치를 인정받았다.
iMerit은 CVPR 2026 Auto3D 챌린지에서 SAM 3와 CLIP 기반 검증을 활용한 자동 주석 파이프라인으로 1위를 차지했다.
PewDiePie가 개발한 오픈소스 AI 플랫폼 Odysseus의 설치 과정과 로컬 모델 구동, Deep Research 및 이미지 편집 기능을 검증한다.
AllenAI가 공개한 MolmoMotion은 언어 지시와 비디오를 기반으로 객체의 미래 3D 궤적을 예측하여 로봇 계획 및 영상 생성 성능을 향상시킨다.
기존 Salesforce 자동화 자산을 Agentforce 에이전트가 활용할 수 있도록 리팩터링하는 전략과 기술적 구현 방법을 다룬다.
NVIDIA의 Skill Spector를 사용하여 AI 에이전트 스킬의 보안 취약점을 스캔하고, Claude Code와 연동하여 안전한 설치 워크플로를 구축하는 방법을 다룬다.
데이터 준비부터 사전 학습, LoRA 파인튜닝, 추론 최적화 및 엣지 디바이스 배포까지 SLM 구축 전 과정을 다루는 실전 부트캠프.
AI 에이전트의 웹 접근 실패 원인인 안티봇 시스템과 CAPTCHA를 분석하고, Web MCP를 통한 안정적인 데이터 수집 방법을 다룬다.
AI 코딩 에이전트에게 명확한 목표를 부여하고 24시간 자율적으로 작업하게 하는 'Continuous Work' 방법론과 인간의 가이드 역할에 대해 탐구합니다.
OpenRouter의 compound model인 Fusion과 Claude Opus 4.8을 6가지 빌드 챌린지로 비교하여 성능과 비용 효율성을 분석한다.
Google Antigravity CLI에 DataRobot 플러그인을 설치하여 LangGraph 에이전트의 실행 과정을 OpenTelemetry로 추적하고 디버깅하는 방법을 다룬다.
LangChain과 GPT-4o를 사용하여 개인의 작업 맥락을 이해하고 도구 사용이 가능한 맞춤형 AI 어시스턴트를 구축하는 실전 가이드.
메타가 페이스북 앱에 도입한 AI 검색 모드는 사용자 게시물을 기반으로 정보를 제공하지만, 여전히 환각 현상과 정보 오류 문제를 겪고 있다.
Databricks가 AI 워크로드의 보안과 규정 준수를 강화하기 위해 자동 ID 관리(AIM), Context-Based Ingress, Private Network Gateway 등 새로운 플랫폼 기능을 발표했다.
Dust는 기업 내 다양한 부서와 데이터를 연결하여 인간과 AI 에이전트가 협업하는 멀티플레이어 AI 플랫폼을 제공한다.
Mobileye는 L2+ 자율주행 시장의 급성장에 대응하여 고성능 SoC와 크라우드소싱 매핑 기술을 통합한 확장 가능한 ADAS 솔루션을 제시한다.
SentinelOne이 EDR 경보를 자동으로 조사하고 증거를 수집하는 'Purple AI Agentic Investigation'을 출시하여 SOC의 조사 역량 부족 문제를 해결합니다.
OpenAI Codex를 활용해 간단한 웹 앱부터 모바일 앱, 2D 게임, 풀스택 서비스까지 구축하는 5가지 실습 프로젝트를 다룬다.
앤드류 응과 해리슨 체이스가 AI 에이전트의 발전, 엔터프라이즈 AI 도입 전략, 그리고 데이터 아키텍처의 중요성을 논의한다.
생성형 AI의 위험을 관리하고 책임 있는 배포를 보장하기 위한 6가지 핵심 거버넌스 프레임워크와 운영 전략이다.
Strands Robots SDK는 LeRobot 스택을 에이전트 도구로 추상화하여 시뮬레이션과 실제 로봇 간의 워크플로를 통합하고 자연어 기반 제어를 지원한다.
AI 에이전트의 보안 활용 가능성, 급증하는 취약점 관리, 경영진의 사이버 리스크 수용 전략을 논의한다.
OpenAI의 Codex가 범용 에이전트로 전환되는 가운데, SpaceXAI의 Cursor 인수와 경쟁사의 급성장으로 AI 시장 점유율 경쟁이 심화되고 있다.
복잡한 규칙을 직접 작성하는 대신, 대규모 학습 가능 함수와 경사 하강법을 통해 AI가 스스로 최적의 해를 찾아가는 그레이디언트 핸드오프 개념을 설명한다.
Kognic은 자율주행 및 ADAS 데이터 라벨링에 특화된 플랫폼으로, 다중 센서 융합과 TISAX 인증을 통해 Encord보다 전문적인 AV 개발 환경을 지원한다.
MIT 연구진이 로봇이 복잡한 환경에서 사물과 위치를 언어로 기억하고 추론할 수 있게 돕는 장기 공간 기억 프레임워크 DAAAM을 개발했다.
LLM 가중치를 변경하지 않고 외부 기억과 가치 레이어를 갱신하여 AI 에이전트의 자율적인 성장을 가능하게 하는 프레임워크 GNOSIS를 소개합니다.
Claude Code의 커스텀 스킬을 활용해 PR 리뷰를 자동화하고, 수정된 PR을 분석하여 리뷰 기준을 지속적으로 업데이트하는 피드백 루프를 구축했다.
AI 코딩 에이전트 도입 과정을 9단계 성숙도 모델로 정의하고, 단순 실험을 넘어 신뢰할 수 있는 엔지니어링 시스템으로 발전하는 전략을 제시한다.
NVIDIA와 Coherent가 텍사스 셔먼에 인듐 인화물(InP) 웨이퍼 제조 시설을 확장하여 AI 데이터 센터의 고속 광학 연결성을 강화한다.
미드저니가 6월 17일 오후 6시(태평양 표준시)에 디스코드와 X를 통해 첫 번째 비밀 하드웨어 프로젝트를 공개하는 라이브스트림을 진행한다.
Anyscale on Azure를 통해 애저 환경 내에서 데이터 거버넌스를 유지하며 Ray 기반의 분산 AI 워크로드를 효율적으로 배포하고 운영하는 방법을 소개한다.
경제학적 모델과 실증 데이터를 통해 AI가 노동 시장의 생산성과 불평등에 미치는 영향을 분석하고 미래를 전망한다.
Intel Foundry가 차세대 공정 Intel 18A-P의 리스크 생산을 시작하며 기존 18A 대비 성능과 전력 효율을 대폭 개선했다.
40만 건의 Claude Code 세션을 분석한 결과, 코딩 기술보다 도메인 전문 지식이 에이전트 활용 효율과 성공률을 결정하는 핵심 요인임이 밝혀짐.
과거 대화 데이터를 재현해 신규 모델의 배포 전 행동을 예측하고 잠재적 위험을 사전에 파악하는 배포 시뮬레이션 방법론을 다룬다.
미 국방부가 생성형 AI를 도입하여 매년 의회에 제출해야 하는 수백 건의 보고서 작성 시간을 획기적으로 단축했다.
RF-DETR 모델로 타이어를 탐지하고 LLM으로 측면 정보를 추출하는 자동화된 비전 파이프라인 구축 방법.
5,000회 이상의 모의 조달 평가 실험을 통해 LLM이 자신의 창조주를 선호하거나 주입된 정체성에 따라 편향된 결정을 내리는 현상을 분석함.
PySpell은 ESP32-S3와 같은 마이크로컨트롤러에서 Python과 Rust의 안전한 하위 집합을 실행하는 샌드박스형 코드 평가기입니다.
Factory Router는 코딩 작업 난이도에 따라 최적의 LLM을 자동으로 선택하여 성능은 유지하면서 API 비용을 최대 25% 절감합니다.
LLM 에이전트의 도구 사용 정책, 인간 개입(HITL), 감사 추적을 제공하여 프로덕션 환경의 신뢰성을 높이는 오픈소스 미들웨어 프레임워크.
LLM 체스 리더보드는 무작위 플레이어 및 체스 엔진과 대국을 통해 LLM의 체스 전략과 에이전트 환경에서의 지시 이행 능력을 정량적으로 평가한다.
AWS가 AI 에이전트가 기업 데이터를 안전하고 정확하게 활용할 수 있도록 돕는 'AWS Context'와 Glue Data Catalog 및 S3 Annotations 신기능을 발표했다.
Snap의 고가 AR 글래스 출시, US-EU 간 AI 협력 논의, Apple의 카메라 내장 AirPods 개발 등 주요 테크 소식을 요약한다.
구글이 제미나이 AI를 탑재하여 자연어 이해와 복합 명령 처리가 가능한 99.99달러의 새로운 스마트 스피커를 출시했다.
Amazon Bedrock AgentCore가 RAG, 웹 검색, 유료 콘텐츠 연동 및 지속적 학습을 위한 최적화 루프를 통해 에이전트 개발과 운영을 지원한다.
LLM이 작성한 코드의 정확성을 보장하기 위해 브라우저, 테스트 스크립트, 이미지 비교 도구 등 검증 환경을 AI에게 제공하는 실무 전략을 다룬다.
XDOF는 로봇 학습을 위한 데이터 파이프라인과 수집 도구를 제공하여 로봇 AI 개발의 병목 현상을 해결하는 인프라 스타트업이다.
LLM 추론 시 발생하는 비결정론적 출력의 원인인 부동소수점 연산과 배치 처리 문제를 분석하고, 캐싱 및 스케줄링을 통한 대응 전략을 제시한다.
AptSelect는 로컬 SQLite 기반의 프롬프트 엔지니어링 워크벤치로, 여러 LLM의 응답을 병렬로 테스트하고 벤치마킹하며 API 키를 로컬에 안전하게 보관할 수 있습니다.
Lightpanda Agent는 브라우저 자동화의 LLM 의존성을 빌드타임으로 제한하여 런타임 비용과 복잡성을 제거한 단일 바이너리 도구이다.
Pramaana Labs는 LLM의 추론 결과에 수학적 형식 검증을 결합하여 법률 및 의료 등 고위험 분야에서 신뢰성을 보장하는 솔루션을 개발한다.
Databricks가 Free Edition에 Genie Code, GPU, Lakebase, Agent Bricks, Lakeflow Designer를 추가하여 데이터 및 AI 프로젝트를 위한 통합 무료 툴킷을 제공한다.
Databricks가 파트너의 AI 제품 개발을 가속화하기 위해 AI 기반의 Well-Architected Framework와 Dev Kit, 오픈소스 참조 구현체인 Firefly를 공개했다.
AI 거버넌스를 개발 과정에 내재화한 기업은 그렇지 않은 기업보다 AI 프로젝트 배포 속도가 12배 빠르고 ROI 달성 확률이 2.2배 높다.
LLM 위원회 구조는 모델 간 합의를 유도하지만, 독창적이고 가치 있는 아이디어를 희석하는 집단 사고(Groupthink) 현상을 초래한다.
LLM이 수학 문제를 해결하는 시대에도, 추상적 개념을 내재화하고 직관을 형성하는 수학 학습 과정에는 여전히 인간의 노력이 필수적이다.
Noema64는 LLM을 전략 플래너로 사용하고 Go 언어로 규칙을 검증하여 설명 가능한 수를 제시하는 오픈소스 체스 엔진이다.
Genesis AI가 인간의 외형 대신 도구 사용 등 실질적 인간 능력을 모방한 범용 로봇 'Eno'를 공개하고 2026년 말 배포를 예고했다.
Thunderbit, Bright Data, Scraping Bee를 사용하여 동일한 이커머스 사이트에서 상품 데이터를 추출하는 성능을 비교하고 각 도구의 특징을 분석한다.
1M 토큰 컨텍스트와 IndexShare 아키텍처를 도입하여 장기 코딩 작업 성능을 극대화한 오픈소스 모델 GLM-5.2가 공개됐다.
Anthropic의 프롬프트 캐싱은 반복되는 컨텍스트를 재사용하여 LLM API 호출 비용과 지연 시간을 크게 줄여주는 최적화 기술입니다.
LLM 기술 면접에서 단순 정의를 넘어 1원칙 사고와 심층적인 기술적 통찰을 보여주는 답변 프레임워크를 제시한다.
cwcode는 터미널에서 실행되는 Go 기반의 코딩 에이전트로, 해시 기반 편집과 프롬프트 캐싱을 통해 비용과 지연 시간을 최적화한다.
Amazon Bedrock의 새로운 InvokeGuardrailChecks API는 에이전트 AI 워크플로의 각 단계에서 리소스 생성 없이 세밀한 안전성 검사를 수행하고 점수 기반의 맞춤형 대응 로직을 구현하게 한다.
Google DeepMind와 영국 정부가 협력하여 주택 건축 허가 신청 처리 시간을 50% 단축하는 AI 계획 도구를 개발하고 있다.
Amazon SageMaker AI가 컨테이너 이미지 캐싱 기능을 도입하여 새로운 인스턴스 시작 시 이미지 다운로드 시간을 제거하고 엔드 투 엔드 스케일링 지연을 최대 50% 개선한다.
데이터 파이프라인의 핵심 계층과 배치, 스트리밍, 메달리온 등 주요 아키텍처 패턴을 정의하고 실무 설계 원칙을 제시한다.
Databricks가 기업 환경에서 안전하고 효율적인 앱 개발을 지원하는 App Spaces, Genie App Builder, 서버리스 마이크로 앱을 공개했다.
P-EAGLE은 speculative decoding의 순차적 병목을 해결하여 모든 draft 토큰을 단일 forward pass로 생성함으로써 추론 처리량을 최대 1.69배 개선한다.
구글이 Android 17과 Wear OS 7을 출시하며 Gemini Omni, Lyria 3 등 최신 AI 모델을 통합한 새로운 픽셀 드롭 기능을 선보였다.
Roboflow의 Track Class Lock은 객체 탐지 시 발생하는 라벨 플리커링을 방지하여 데이터 안정성을 높이는 워크플로 블록이다.
퀄컴이 XR 기기용 신형 칩 'Snapdragon Reality Elite'를 공개하며 GPU, CPU, NPU 성능을 대폭 강화하고 발열과 배터리 효율을 개선했다.
애플이 Siri의 시각적 맥락 이해를 돕기 위한 카메라 탑재 AirPods와 차세대 폴더블 아이폰 등 2027년 출시 예정인 하드웨어 로드맵을 준비 중이다.
WordPress VIP 보고서에 따르면, 소비자는 AI 생성 답변에 대한 신뢰도가 낮으며 브랜드가 AI를 마케팅에 활용하는 것을 부정적으로 인식하는 경향이 있다.
Roboflow의 RF-DETR 모델과 워크플로를 사용하여 콘택트렌즈의 균열과 기포를 자동으로 탐지하고, 신뢰도에 따라 pass, review, fail로 분류하는 시스템을 구축한다.
OpenAI의 2025년 매출은 130억 달러로 성장했으나, 연구개발 비용이 191억 달러에 달하며 수익성 확보에 난항을 겪고 있다.
의료 보험 사전 승인(PA) 시스템에서 LLM 판정 모델의 신뢰성을 높이기 위해, 정답 데이터를 섭동시켜 오답을 생성하고 이를 모델이 정확히 탐지하는지 검증하는 평가 프레임워크를 구축했다.
LLM 에이전트가 상호작용을 통해 숨겨진 환경을 학습하는 능력을 결정적 유한 오토마타(DFA) 기반 테스트베드로 평가한 연구.
Memento는 이메일 아카이브를 SQLite, FTS, 벡터 임베딩으로 인덱싱하여 에이전트 기반의 개인 위키와 검색 기능을 제공하는 오픈소스 도구이다.