AI가 쓴 티 안 나게 글 쓰는 법: 텍스트 교정 프롬프트 팁
AI 특유의 상투적 표현과 문장 구조를 제거하고 가독성을 높여 인간적인 어조로 글을 수정하는 구체적인 프롬프트 지침이다.
총 100건
AI 특유의 상투적 표현과 문장 구조를 제거하고 가독성을 높여 인간적인 어조로 글을 수정하는 구체적인 프롬프트 지침이다.
vLLM 0.20 출시와 함께 DeepSeek V4를 위한 하드웨어 최적화 경쟁 및 Poolside, NVIDIA의 신규 모델 릴리스 소식을 다룹니다.
저비용 모델로 중복을 필터링하고 고성능 모델로 계획을 수립하는 계층형 에이전트 구조를 통해 CI 로그 분석 비용을 절감하고 성능을 높인 사례입니다.
이미지 픽셀 공간의 한계를 극복하기 위한 잠재 확산 모델(LDM)의 아키텍처와 VAE, CLIP을 활용한 멀티모달 가이던스 생성 기법을 심도 있게 다룹니다.
GPU의 하드웨어 아키텍처를 이해하고 최적의 성능을 내기 위한 벤치마킹, 프로파일링 기법 및 Triton을 이용한 커널 작성법을 다룹니다.
Claude Code로 클라우드 보안 도구를 개발하며 겪은 할루시네이션 문제를 해결하기 위해 결정론적 설계와 엄격한 테스트 체계를 구축한 경험담이다.
AI에게 특정 성격을 부여하는 '페르소나 설정'이 의도치 않게 성차별적 고정관념을 강화할 수 있음을 입증했다. 특히 반사회적 성격 특성이 주어질 때 모델의 젠더 편향이 급격히 심화되며, 이는 교육이나 고객 서비스용 AI 설계 시 성격 설정이 공정성 제어의 핵심 변수임을 시사한다.
의료 영상 분석에서 기존 AI 모델들이 특정 조건에서 데이터를 제대로 구분하지 못하고 다수결로만 예측하는 '고전적 붕괴' 현상을 양자 컴퓨팅 기술로 해결할 수 있음을 입증했다. 실제 흉부 엑스레이 데이터를 활용하여 양자 머신러닝이 실질적인 의료 진단 보조 도구로서 고전 모델보다 더 정밀한 분류가 가능함을 보여준 중요한 사례이다.
OpenAI GPT-5.5의 기본 지침(base_instructions) 중 사용자 쿼리와 직접 관련이 없는 특정 동물이나 상상 속 생물의 언급을 엄격히 금지하는 내용이 공개됐다.
여러 Claude Code 세션의 진행 상태를 칸반 보드로 시각화하고 자동화하는 오픈 소스 IDE Vibeyard가 공개됐다.
Claude Code와 상호작용할 때 직접적인 명령 대신 질문을 던지는 소크라테스식 문답법이 숨겨진 가정을 드러내고 더 나은 프롬프트를 생성하는 데 효과적이다.
Barracuda는 Databricks 플랫폼을 활용해 보안 텔레메트리를 통합하고, AI를 제품의 핵심 아키텍처에 내재화하여 동적으로 적응하는 AI 네이티브 보안 솔루션을 구축했다.
기존의 JSON 스키마 준수 여부를 넘어 실제 데이터 값의 정확도와 신뢰성을 측정하는 새로운 구조화된 출력 벤치마크가 공개됐다.
WebGPU를 활용해 브라우저 로컬 환경에서 각 에이전트의 의사결정을 LLM으로 처리하는 바나나 수집 시뮬레이션이다.
테일러 스위프트가 AI를 이용한 음성 및 이미지 도용에 대응하기 위해 자신의 특정 음성 문구와 무대 사진에 대한 상표권 보호를 신청하며 법적 대응 수단을 확장하고 있다.
Sprite-AI는 텍스트 설명을 기반으로 게임 개발에 즉시 사용 가능한 다양한 해상도의 픽셀 아트 에셋을 생성하고 편집할 수 있는 도구이다.
AI 에이전트의 무분별한 시스템 접근과 비용 발생 문제를 해결하기 위해 방화벽, 샌드박스, 비용 추적 등 7가지 보안 및 운영 도구를 포함한 AgentOpsSec 프레임워크가 공개됐다.
Google Docs를 마크다운으로 변환하여 AI 에이전트가 편집하게 한 뒤, 서식 파괴 없이 변경 사항만 동기화하는 CLI 도구 ExtraSuite가 공개됐다.
OpenAI와 Microsoft의 독점 계약 수정에 따라 Amazon AWS가 Bedrock 서비스에 OpenAI 모델과 신규 에이전트 서비스를 즉시 도입했다.
DX의 데이터 분석 결과, AI를 통한 개발 생산성 향상은 개별 도구보다 코드 모듈화, 문서화, CI/CD와 같은 조직적 시스템 최적화에 달려 있다.
비즈니스 사용자가 복잡한 설정이나 SQL 지식 없이 Databricks Excel Add-in을 사용하여 레이크하우스 데이터에 직접 연결하고 쿼리하는 방법을 설명합니다.
Databricks와 Redox의 파트너십을 통해 자연어 프롬프트와 Zerobus 기술로 EHR 데이터를 실시간 스트리밍하고 AI 결과를 즉각 반영하는 의료 데이터 생태계를 구축했다.
Cursor 개발자가 에이전트의 자율성을 극대화하여 수백 개의 에이전트가 동시에 코드를 작성하고 테스트하는 '소프트웨어 팩토리' 구축 방법론을 제시한다.
ChromaDB 컬렉션을 읽기 전용 가상 파일 시스템으로 변환하여 에이전트가 Docker 샌드박스 없이도 고속으로 파일을 탐색하고 읽을 수 있게 해주는 도구이다.
아마존이 제품 상세 페이지에서 실시간 음성 대화로 정보를 제공하는 AI 기반 'Join the chat' 기능을 공개했습니다.
변칙적인 공격 프롬프트를 100% 탐지하면서도 오탐이 없는 고성능 AI 보안 게이트웨이 Arc Gate가 공개됐다.
Meta의 AI 모델 정교화 및 콘텐츠 모더레이션을 담당하던 아일랜드 Covalen 소속 노동자 700여 명이 대규모 해고 통보를 받았습니다.
Meta는 AI 모델 학습과 추론을 효율적으로 지원하기 위해 설계된 차세대 AI 최적화 데이터 센터 인프라의 구조와 핵심 구성 요소를 공개했다.
OpenAI가 출시한 새로운 ChatGPT 이미지 모델을 활용하여 마케팅 배너, 인포그래픽, 웹사이트 시안, 소셜 미디어 콘텐츠 등 실무에 즉시 적용 가능한 40가지 이상의 구체적인 활용 사례를 소개한다.
확산 모델이 자기회귀 모델보다 데이터 효율적인 이유를 수학적 프레임워크와 역사적 발전 과정을 통해 분석하고 최신 기술인 플로우 매칭까지 다룹니다.
근시안적 보상을 추구하는 AI 모델이 장기적인 미래를 정확히 예측하도록 단기 예측의 사슬과 중간 보상을 활용하는 '재귀적 예측' 기법을 제안한다.
AI 모델의 성능을 지속적으로 측정하고 신뢰할 수 있는 평가 플랫폼을 구축하기 위한 데이터 파이프라인, 라벨링 워크플로 및 설계 원칙을 제시한다.
OpenAI 연구원들이 AI가 수학적 추론 능력을 통해 복잡한 난제를 해결하고 자동화된 연구자로 진화하며 과학 전반에 미칠 영향을 논의한다.
Li et al. (2018)의 방법론을 활용하여 다양한 아키텍처의 손실 경관을 브라우저에서 실시간으로 시각화하고 최적화 경로를 분석하는 도구이다.
비디오 생성 AI가 겪는 물리적 법칙 무시 현상을 해결하기 위해 학습 데이터 중 부정적인 영향을 주는 샘플을 식별하고 제거하여 품질을 높이는 MOTIVE 기법을 소개한다.
LlamaIndex의 오픈소스 파서 LiteParse를 사용하여 복잡한 금융 PDF 문서를 구조화된 데이터로 변환하고 자율적인 금융 분석 에이전트를 구축하는 과정을 다룹니다.
Thorsten Zander 교수가 수동형 뇌-컴퓨터 인터페이스(BCI)를 활용해 AI 정렬 문제를 해결하고 학습 효율을 높이는 방법론을 제시했다.
OpenAI가 내부 성장 목표 달성에 실패한 가운데, 구글의 군사 AI 계약 반대 및 EU의 안드로이드 개방 명령 등 주요 AI 업계 소식을 다룹니다.
SenseTime이 시각 인코더와 VAE 없이 픽셀을 직접 처리하는 NEO-Unify 아키텍처 기반의 오픈소스 멀티모달 모델 SenseNova-U1을 발표했다.
현재의 LLM 산업이 실질적 수익 모델 없이 내러티브와 과잉 투자에 의존하는 거대한 경제적 거품이며, 구조적 한계로 인해 약속된 지능 수준에 도달하기 어렵다는 비판적 분석이다.
터키어 위키피디아를 기반으로 전문가가 검수한 IOB 태그 방식의 고품질 개체명 인식(NER) 데이터셋인 Turkish WikiNER가 공개되었습니다.
사용자의 실제 음원 반복 청취 데이터를 텍스트 분석과 결합하여 가사 검색의 정확도를 높이는 BehavioralLure 시스템을 소개합니다.
NVIDIA가 텍스트, 이미지, 비디오, 오디오를 통합 처리하며 롱 컨텍스트와 에이전트 기능에 최적화된 30B-A3B 규모의 Nemotron 3 Nano Omni 모델을 발표했다.
Seedance 2.0을 활용해 단일 생성으로 여러 컷이 포함된 시네마틱 영상을 제작하는 세 가지 프롬프트 기법과 캐릭터 일관성 유지 방법을 다룹니다.
대규모 언어 모델 학습을 위해 단일 GPU의 한계를 넘어 여러 GPU를 효율적으로 활용하는 데이터, 텐서, 파이프라인 병렬 처리 기법의 핵심 원리와 구현 방식을 다룹니다.
기존의 AI 모델은 자신이 잘 모르는 것(학습 부족)과 데이터 자체가 모호한 것(해석의 다양성)을 구분하지 못해 일괄적인 신뢰도 점수만 제공했다. 이 논문은 두 종류의 불확실성을 분리하여 측정함으로써, 데이터를 더 수집해야 할 상황과 사람이 직접 검토해야 할 상황을 명확히 구분해 AI 시스템의 의사결정 신뢰도를 높인다.
기존의 로봇 학습 모델은 행동 라벨이 없는 일반 비디오 데이터를 활용하는 데 한계가 있었으나, 이 논문은 시각적 예측과 행동 추론을 분리하여 대규모 웹 데이터를 효과적으로 학습할 수 있는 프레임워크를 제시한다. 이를 통해 데이터 수집 비용을 크게 낮추면서도 실제 로봇 조작 작업에서 SOTA 성능을 기록했다.
Transformer 모델의 추론 시 발생하는 KV 캐시 메모리 병목 현상을 해결하기 위해 층 간 캐시 공유를 제안한다. 기존의 시간축 압축 방식과 달리 깊이 차원의 중복성을 활용하여 메모리 사용량을 획기적으로 줄이면서도 추론 속도를 개선한다.
기존의 얼굴 이미지 품질 평가(FIQA)는 딥러닝 모델의 마지막 층 결과물만 사용했으나, 본 논문은 중간 층에서도 유의미한 품질 정보가 생성됨을 최초로 입증했다. 이를 통해 연산량을 최대 50% 절감하면서도 최신 기술(SOTA) 수준의 정확도를 유지할 수 있어 저사양 기기에서의 실시간 얼굴 인식 시스템 구축에 기여한다.
LLM 에이전트가 복잡한 보상 함수나 상세한 피드백 없이도 상호작용을 통해 숨겨진 안전 제약 조건을 스스로 발견할 수 있음을 입증했다. 이는 안전이 중요한 환경에서 사람이 일일이 규칙을 작성하지 않아도 에이전트가 안전하게 작동할 수 있는 새로운 학습 패러다임을 제시한다.
기존의 문서 처리 시스템은 추출 결과가 원본과 얼마나 일치하는지 스스로 검증할 수 없어 오류가 그대로 하류 시스템에 전달되는 문제가 있었다. 이 논문은 추출된 데이터를 다시 이미지나 텍스트로 그려보고 원본과 비교하는 '재구성' 방식을 통해 별도의 정답 레이블 없이도 추출 품질을 실시간으로 측정하고 오류를 자동 수정하는 새로운 패러다임을 제시한다.
시각-언어 모델(VLM)이 복잡한 추론 과정에서 겪는 지각적 오류와 환각 문제를 해결하기 위해 토큰 단위의 세밀한 피드백을 제공하는 새로운 보상 모델을 제안합니다. 기존의 결과 중심 보상 방식이 가진 한계를 극복하고 추론 단계마다 시각적 근거를 검증함으로써 모델의 신뢰성을 높였습니다.
표 데이터를 AI 모델에 입력할 때 CSV, JSON 등 어떤 형식을 선택하느냐에 따라 검색 성능이 크게 요동치는 불안정성 문제를 발견했습니다. 연구진은 여러 형식의 평균값인 '중심점'을 활용해 형식에 상관없이 표의 본질적인 의미를 정확하게 찾아내는 기술을 제안하여 검색 시스템의 신뢰도를 높였습니다.
얼굴 인식 시스템의 신뢰성을 높이기 위해서는 입력 이미지의 품질을 정확히 판단하는 것이 필수적이다. 이 논문은 별도의 추가 학습이나 복잡한 연산 없이 기학습된 Vision Transformer의 내부 어텐션 정보만으로 이미지 품질을 측정하는 효율적인 방법을 제시한다.
생성형 AI 모델의 성능 평가와 안전성 검증에 드는 막대한 비용과 시간을 획기적으로 줄여주는 프레임워크이다. 베이지안 통계와 전이 학습을 결합하여 아주 적은 수의 테스트만으로도 전체 성능을 정확히 예측하고, 모델이 취약한 특정 실패 지점을 지능적으로 찾아낸다.
자율 주행 시스템이 학습하지 못한 미지의 객체를 정확히 식별하는 것은 안전을 위해 필수적이다. 이 논문은 기존 2D 기법의 한계를 넘어 3D 특징 공간에서 직접 이상치를 탐지하는 효율적인 방법론과 새로운 벤치마크 데이터셋을 제공하여 실전 자율 주행의 신뢰성을 높인다.
기존 AI 에이전트는 웹페이지에서 정보를 찾아 답변을 주지만, 그 정보가 페이지 어디에 있는지 사용자가 직접 확인하기 어렵다는 한계가 있다. PageGuide는 답변의 근거를 HTML 요소에 직접 시각적으로 연결하여 사용자가 AI의 답변을 즉시 검증하고 복잡한 작업을 단계별로 수행할 수 있도록 돕는다.
LLM의 추론 능력을 높이기 위해 생성 길이를 늘리는 시도가 많지만, 이는 비용과 속도 면에서 비효율적이다. 이 논문은 추가적인 보상 모델 없이도 추론 과정을 압축하면서 학습 안정성을 확보하는 방법을 제시하여 효율적인 AI 추론 연구의 새로운 방향을 제시한다.
동일한 레이어를 반복 사용하는 루프형 모델이 실제 고유 레이어를 사용하는 모델 대비 어느 정도의 효율을 갖는지 정량적으로 측정했다. 이를 통해 루프형 아키텍처 설계 시 단순한 손실값 감소를 넘어 실제 추론 비용 대비 성능 이득이 있는지 판단할 수 있는 기준을 제공한다.
기존 OCR 시스템은 PDF를 단순 텍스트나 마크다운으로 변환하여 수식이나 표의 구조적 정보를 손실하는 경우가 많았다. 이 논문은 단순 텍스트 인식을 넘어 실제 논문 출판에 즉시 사용 가능한 컴파일 가능한 LaTeX 코드로 복원하는 기술을 제시하여 과학 지식의 재사용성을 극대화한다.
LLM이 새로운 지식을 배울 때 기존에 알고 있던 사실을 틀리게 대답하는 할루시네이션 현상이 발생하는 근본 원인을 규명했다. 파인튜닝 과정에서 발생하는 지식 간섭을 지속 학습 관점에서 해석하고, 자기 증류 기법을 통해 기존 지식 보존과 새 지식 습득을 동시에 달성할 수 있음을 입증했다.
기존의 카메라 제어 이미지 편집 방식은 단일 이미지 기반 확산 모델을 사용하여 연속적인 카메라 움직임에서 화면이 깨지거나 구조가 왜곡되는 문제가 있었다. 이 논문은 비디오 생성 모델의 연속적인 시점 정보를 활용하고 기하학적 가이드를 모델 전체 구조에 통합하여, 복잡한 카메라 이동 중에도 사물의 구조를 완벽하게 유지하는 기술을 제시한다.
인간의 자세 추정, 신체 분할 등 인간 중심 비전 작업에서 고해상도 데이터 처리는 필수적이지만 연산 비용이 매우 높았다. Sapiens2는 10억 장의 고품질 데이터와 효율적인 4K 아키텍처를 통해 기존 모델 대비 자세 추정 정확도를 4 mAP 개선하고 신체 분할 성능을 24.3 mIoU 높이는 등 압도적인 성능 향상을 달성했다.
기존의 샷 경계 검출 기술은 단순한 장면 전환점만 찾을 뿐, 전환의 종류나 샷 사이의 논리적 관계를 파악하지 못해 비디오 생성 모델 학습용 데이터 정제에 한계가 있었다. 이 논문은 Transformer 기반의 샷 쿼리 방식을 도입하여 미세한 편집 오류인 'Sudden Jump'까지 잡아내고 샷 간의 관계를 구조적으로 예측함으로써 고품질 비디오 데이터셋 구축의 효율성을 극대화한다.
기존의 LLM 에이전트 평가는 대화의 처음부터 끝까지 반복해서 실행하는 방식이라 비용이 많이 들고 희귀한 오류 상황을 발견하기 어렵다. 이 논문은 대화의 중간 지점에서 여러 갈래로 분기하는 트리 구조 평가 방식을 도입하여, 중복 계산을 줄이면서도 에이전트의 취약점을 더 효과적으로 찾아낸다.
LLM 에이전트가 역할을 맡을 때 발생하는 인간과 유사한 인지 편향인 행위자-관찰자 비대칭성(AOA)을 최초로 규명했습니다. 실행 에이전트는 외부 탓을 하고 검토 에이전트는 내부 탓을 하는 이 편향은 협업 효율을 저해하며, 이를 해결하는 ReTAS 프레임워크는 에이전트 간의 객관적인 합의 형성을 가능하게 합니다.
LLM 학습에 사용되는 방대한 데이터 중 어떤 데이터가 모델 성능에 기여하는지 파악하는 것은 중요하지만, 기존 방식은 계산 비용이 너무 높았습니다. For-Value는 복잡한 역전파 과정 없이 단 한 번의 순방향 추론만으로 데이터의 가치를 정확히 측정하여 학습 효율을 극대화합니다.
기존 AI 에이전트 평가는 단발성 작업에 치중되어 실제 사무 환경처럼 며칠에 걸쳐 상황이 변하고 다양한 파일 형식을 다루는 능력을 측정하기 어려웠다. 이 논문은 외부 환경이 스스로 변하는 동적 환경을 구축하여 에이전트가 인간 동료처럼 지속적으로 협업할 수 있는지 평가하는 새로운 기준을 제시한다.
시각, 언어, 행동을 통합한 VLA 모델이 로봇 공학의 주류가 됨에 따라 텍스트 기반 AI와는 차원이 다른 물리적 안전 위협이 발생하고 있다. 이 논문은 VLA 시스템의 고유한 취약점을 체계적으로 분류하고 차세대 로봇 시스템이 갖춰야 할 안전 설계 가이드라인을 제시한다.
기존 멀티모달 모델이 의존하던 복잡한 시각 인코더(VAE 등)를 완전히 제거하고 원시 픽셀 데이터를 직접 처리하는 혁신적인 구조를 제안한다. 이를 통해 이미지 이해와 생성 작업 간의 불일치를 해결하고, 미세한 시각적 디테일이 필요한 작업에서 기존 모델을 압축하는 성능을 보여준다.
기존의 시각적 공간 지능(VSI) 평가 도구들이 실제 비디오 입력과 일치하지 않는 잘못된 정답지를 가지고 있어 모델의 능력을 왜곡하고 있음을 밝혀냈습니다. 이를 해결하기 위해 3D 주석을 전면 재검토하고 프레임 수에 따라 정답이 변하는 새로운 평가 체계를 도입하여 모델의 실제 공간 추론 능력을 더 엄밀하게 측정할 수 있게 되었습니다.
기존 비디오 생성 모델은 물리적 법칙에 대한 이해 부족으로 물체가 왜곡되거나 사라지는 기하학적 오류를 자주 범한다. World-R1은 모델 구조 변경 없이 강화학습만으로 비디오의 3D 일관성을 획기적으로 개선하여, 단순한 영상 제작을 넘어 실제 세상을 시뮬레이션하는 월드 모델로의 진화를 가능하게 한다.
기존 멀티 에이전트 시스템은 고정된 워크플로우와 특정 프레임워크에 종속되어 복잡한 실무 문제를 해결하는 데 한계가 있다. 이 논문은 에이전트를 '인재'로 정의하고 기업 조직 구조를 모방한 관리 계층을 도입하여, 스스로 팀을 구성하고 학습하며 진화하는 자율 AI 조직의 가능성을 제시한다.
로컬 환경에서 개별 Docker 컨테이너 기반으로 자율 AI 에이전트를 실행하고 관리할 수 있는 데스크톱 앱 Apprentice의 대규모 업데이트가 공개됐다.
좁은 컨텍스트 윈도우(8k) 환경에서 효율적으로 작동하기 위해 역할을 분리하고 토큰 예산을 엄격히 관리하는 코딩 에이전트 설계 사례이다.
Claude Code가 작성한 코드가 실제 브라우저에서 계획대로 작동하는지 Playwright MCP를 통해 자동으로 검증하고 리포트를 생성하는 오픈소스 도구 Opslane Verify가 공개됐다.
AI 에이전트가 마크다운 문서의 특정 위치에 남긴 인라인 피드백을 정확히 이해하고 수정할 수 있게 돕는 MCP 기반 도구 md-redline이 공개되었다.
9단계 공정과 21개 에이전트를 활용한 고도로 구조화된 소설 집필 시스템을 구축했으나, AI 특유의 문체 정형화 문제를 해결하기 위해 작가의 목소리를 보존하는 피드백 도구로 피벗한 사례이다.
AI 에이전트가 흔히 저지르는 하드코딩, 무한 루프, 도구 할루시네이션 등을 로컬에서 자동 검사하는 오픈소스 도구 Agent Verifier가 출시되었다.
Replit, Bolt, v0 등 주요 AI 코딩 도구의 시스템 프롬프트를 4가지 지표로 평가한 결과, 가장 짧은 프롬프트를 가진 Replit이 구조화와 명확성 면에서 최고점을 기록했다.
LLM과 이미지 생성 모델을 활용해 터미널 환경에서 실시간으로 삽화가 포함된 분기형 동화를 생성하는 오픈소스 도구이다.
Claude Code를 기반으로 밤새 자율적으로 코딩, 테스트, 리뷰를 수행하는 오픈소스 도구 Night Shift가 공개됐다.
Claude Artifacts와 Anthropic API를 직접 연동하여 노드를 확장하며 아이디어를 시각화하는 도구가 공개됐다.
Claude Code 에이전트가 H100 GPU 환경에서 GPT-2 350M 모델의 아키텍처를 반복 실험을 통해 현대적인 구조로 자동 개선했다.
Amazon Nova 2 Sonic을 사용하여 기존 텍스트 기반 AI 에이전트를 저지연 음성 어시스턴트로 전환하기 위한 아키텍처 설계 및 프롬프트 최적화 전략을 제시합니다.
Claude Code의 작업 지연을 방지하고 5종의 독립 에이전트로 코드 품질을 강제 검증하는 거버넌스 도구 cc-sentinel이 공개됐다.
에이전트의 의도 상실과 드리프트 문제를 해결하기 위해 Specify-Plan-Act-Retain 루프를 사용하는 경량화 도구 spar-kit이 공개됐다.
긴 지침 대신 고밀도로 압축된 'Seed' 패턴을 사용하여 LLM과 인간의 인지 효율 및 추론 정확도를 높이는 CogniSeeds 프로토콜을 제안한다.
보안 전문가 페르소나를 부여한 프롬프트에 서브에이전트 병렬 실행 지시를 추가하여 코드베이스의 취약점을 정밀 진단하는 방법이다.
AI 에이전트의 도구 호출 데이터를 구조화하여 컨텍스트를 82% 압축하고 성능을 개선하는 오픈소스 프로젝트 Crucible이 공개됐다.
관계형 AI가 생성하는 반복적 서사가 사용자의 정체성 형성에 개입하여 시스템 변화 시 정체성 붕괴를 초래할 수 있는 구조적 취약성을 분석했다.
Anthropic이 Claude를 Photoshop, Blender, Ableton 등 주요 창작 소프트웨어와 직접 연결하여 AI가 앱 내 작업을 수행할 수 있는 커넥터 세트를 출시했다.
Claude Code의 내장 제목 생성기가 영어만 지원하는 문제를 해결하기 위해, Haiku 모델을 활용한 다국어 세션 제목 생성 및 관리 도구가 공개됐다.
Claude Code가 사용자의 입력 없이도 외부 이벤트를 감지하고 자율적으로 행동할 수 있게 해주는 오픈 프로토콜 World2Agent(W2A)가 공개됐다.
기존 수치 중심 벤치마크의 불신을 해결하기 위해 실제 엔지니어들의 주관적 체감을 정량화하는 VibeBench 프로젝트가 시작됐다.