2026년 3월 5일 AI 뉴스 아카이브

r/ClaudeCode Coding Agents

Claude Code 업데이트로 Opus 4.7 컨텍스트 1M 강제 적용

Claude Code 2.1.117 버전에서 Opus 4.7의 컨텍스트 윈도우를 200K에서 1M로 수정하며 자동 압축 로직이 변경됐다.

Claude Code

The Verge AI

Anthropic의 가장 위험한 보안 모델 Mythos, 디스코드 그룹에 유출

Anthropic이 보안 위험으로 공개를 제한한 사이버 보안 특화 모델 'Mythos'가 서드파티 계약자의 접근 권한과 데이터 유출 정보를 이용한 비인가 그룹에 의해 2주간 사용된 사실이 밝혀졌다.

AICodeKing Coding Agents Agents

AI 코딩 에이전트의 한계 돌파! 대규모 코드 검색을 위한 Claude Context

Claude Context는 MCP를 통해 AI 코딩 에이전트에 시맨틱 검색 기능을 추가하여 대규모 코드베이스의 맥락 파악 효율을 높여주는 오픈소스 도구이다.

Claude CodeMCPZilliz

Wired AI

인터넷에 넘쳐나는 AI '슬롭' 잡는 청소부, Pangram의 실시간 탐지기

Pangram Labs가 Reddit, X, LinkedIn 등 주요 소셜 플랫폼의 게시물이 AI로 생성되었는지 실시간으로 판별하는 Chrome 확장 프로그램을 출시했습니다.

Databricks Blog

Databricks가 제안하는 의료 AI의 미래: 유전체부터 웨어러블까지 통합하기

Databricks는 유전체, 의료 영상, 임상 기록 및 웨어러블 데이터를 Unity Catalog 기반의 레이크하우스로 통합하여 정밀 의료 AI를 프로덕션에 배포하는 아키텍처를 제시한다.

r/AutoGPT

지저분한 PDF와 스크립트 뭉치에서 탈출하는 데이터 중심 파이프라인

파편화된 데이터 전처리 스크립트를 재사용 가능한 연산자 기반 파이프라인으로 구조화하는 dataflow 프로젝트가 공유됐다.

r/LLMDevs Audio AI Companies

LLM 음성 통화의 끊김 현상, 시퀀스 버퍼와 백프레셔로 해결하기

Twilio WebSocket 기반 LLM 음성 에이전트 운영 중 발생한 오디오 패킷 손실 및 순서 뒤바뀜 문제를 시퀀스 인식 버퍼와 백프레셔 제어로 해결한 실무 사례이다.

DeepgramTwilio

r/LLMDevs Benchmarks

비싼 LLM 대신 소형 모델로 OCR 비용 90% 아끼는 방법

42개의 표준 문서를 대상으로 7,560회의 테스트를 수행한 결과, 소형 모델이 고가 모델 수준의 OCR 정확도를 훨씬 낮은 비용으로 달성함을 확인했다.

ocr-mini-bench

r/ClaudeCode

AI 코딩 에이전트의 실수를 막는 Claude Code용 인간 리뷰 도구

Claude Code가 생성한 변경 사항을 개발자가 최종 승인하고 보안 취약점을 점검할 수 있게 돕는 오픈소스 스킬이 공개됐다.

r/neuralnetworks Domain AI

금융·의료 AI, 일반 모델보다 정확도 50% 높다? DSLM의 실전 가치

금융, 법률 등 고위험 도메인에서 도메인 특화 모델(DSLM)이 일반 LLM보다 정밀도와 환각 방지 측면에서 우수하며, RAG와 결합 시 시너지가 극대화된다.

BloombergGPT

CrewAI Blog

간호사의 업무 시간을 80% 단축하는 CrewAI의 의료용 에이전트 워크플로

CrewAI의 멀티 에이전트 시스템을 활용해 수동 환자 접수 프로세스를 자동화함으로써 간호사의 행정 업무 시간을 80% 절감하고 보험 검증 오류를 개선한다.

HF Community Blogs

남아시아의 국민 보드게임 Carrom, 이제 LLM의 물리 추론 벤치마크가 되다

남아시아의 인기 보드게임 Carrom을 OpenEnv 호환 물리 시뮬레이션으로 구현하여 LLM의 공간 추론과 물리 법칙 준수 능력을 평가하는 새로운 강화학습 환경을 공개했습니다.

HF Community Blogs

Hugging Face가 공개한 mlinter, AI 에이전트도 이해하는 모델 검수 도구

Transformers 라이브러리의 단일 파일 모델링 정책을 유지하면서 복잡한 설계 규칙을 자동으로 검증하는 전용 린터 mlinter가 공개되었습니다.

r/deeplearning Architecture

SVM의 핵심 원리부터 커널 트릭까지 한눈에 이해하는 시각화 가이드

서포트 벡터 머신의 마진 최대화, 커널 트릭, 힌지 손실 등 복잡한 개념을 애니메이션으로 시각화하여 설명한 튜토리얼이다.

SVM

r/PromptEngineering

환각 방지 가드레일이 포함된 에이전트용 시스템 프롬프트 구조

에이전트가 직접 파싱하고 주입할 수 있도록 ID, 카테고리, 입출력 형식이 구조화된 안티 환각 시스템 프롬프트 체계이다.

Simon Willison

GitHub Copilot 가격 정책 변경, 코딩 에이전트가 불러온 연산 비용의 한계

GitHub이 코딩 에이전트 도입에 따른 연산 비용 급증으로 인해 Copilot 개인 플랜의 사용 제한을 강화하고 가격 구조를 개편했다.

Alignment Forum

뉴런 하나가 여러 개념을 처리하는 이유, 수학적으로 증명됐다

신경망이 중첩(Superposition) 상태에서 개념을 계산할 때 필요한 뉴런 수의 하한선과 상한선이 sqrt(m) 수준임을 수학적으로 증명한 연구를 소개합니다.

r/artificial Companies Language Models

Anthropic의 Claude Mythos 비공개, 누가 AI 접근권을 결정하는가?

Anthropic의 Claude Mythos 비공개 결정을 계기로, 고성능 AI의 접근 권한을 공동으로 관리하는 집단 방어 거버넌스 프레임워크가 제안됐다.

AnthropicClaude MythosGPT-2

r/vibecoding Dev Tools Language Models

Gemini로 앱 만들 때 꼭 알아야 할 실전 팁과 주의사항

Google AI Studio와 Gemini를 활용해 앱을 개발할 때 필요한 도메인 연결, 프롬프트 전략 및 모델 선택 가이드를 제시한다.

FirebaseGeminiGoogle AI Studio

150

2026년 3월 5일 AI 뉴스

Claude Code 업데이트로 Opus 4.7 컨텍스트 1M 강제 적용

Anthropic의 가장 위험한 보안 모델 Mythos, 디스코드 그룹에 유출

AI 코딩 에이전트의 한계 돌파! 대규모 코드 검색을 위한 Claude Context

인터넷에 넘쳐나는 AI '슬롭' 잡는 청소부, Pangram의 실시간 탐지기

Databricks가 제안하는 의료 AI의 미래: 유전체부터 웨어러블까지 통합하기

지저분한 PDF와 스크립트 뭉치에서 탈출하는 데이터 중심 파이프라인

LLM 음성 통화의 끊김 현상, 시퀀스 버퍼와 백프레셔로 해결하기

비싼 LLM 대신 소형 모델로 OCR 비용 90% 아끼는 방법

AI 코딩 에이전트의 실수를 막는 Claude Code용 인간 리뷰 도구

금융·의료 AI, 일반 모델보다 정확도 50% 높다? DSLM의 실전 가치

간호사의 업무 시간을 80% 단축하는 CrewAI의 의료용 에이전트 워크플로

남아시아의 국민 보드게임 Carrom, 이제 LLM의 물리 추론 벤치마크가 되다

Hugging Face가 공개한 mlinter, AI 에이전트도 이해하는 모델 검수 도구

SVM의 핵심 원리부터 커널 트릭까지 한눈에 이해하는 시각화 가이드

환각 방지 가드레일이 포함된 에이전트용 시스템 프롬프트 구조

GitHub Copilot 가격 정책 변경, 코딩 에이전트가 불러온 연산 비용의 한계

뉴런 하나가 여러 개념을 처리하는 이유, 수학적으로 증명됐다

Anthropic의 Claude Mythos 비공개, 누가 AI 접근권을 결정하는가?

Gemini로 앱 만들 때 꼭 알아야 할 실전 팁과 주의사항

복잡한 코딩 없이 클릭만으로 유전자-환경(GxE) 상호작용 분석

LLM 무단 복제 방지: 추론 과정 재작성으로 성능 61% 저하 유도

일론 머스크의 SpaceX, AI 코딩 시장 장악 위해 Cursor 인수 추진

OpenAI의 24시간 자율 에이전트 스튜디오 유출과 구글의 반격

LLM 판사들의 치명적 약점: 제시 순서만 바꿔도 판정 결과가 뒤집힌다

프롬프트 수정할 때마다 다른 게 깨진다면? 4단계 수술적 디버깅 가이드

스파게티 코드는 끝, LangGraph 기반 클린 아키텍처 템플릿 공개

MIT 모든 실험실이 AI로 무장했다: 단백질 설계부터 로켓 엔진 최적화까지

버려지는 열로 AI 연산을? MIT의 혁신적인 무전력 데이터 처리 기술

애플의 AI 지각생 탈출기, 새로운 CEO와 함께 반전 드라마 쓸까

OpenAI의 차세대 이미지 모델 gpt-image-2 성능 분석

Meta의 28번째 미국 데이터 센터, 털사에 10억 달러 규모 AI 기지 구축

MS 코파일럿, 피크 시간대 데이터 경계 밖 추론 허용하는 플렉스 라우팅 도입

Google DeepMind 연구원이 직접 밝히는 확산 모델의 작동 원리와 설계 전략

ChatGPT 이미지 생성의 진화, 이제 2k 해상도와 자유로운 비율까지

메타 직원들의 마우스 클릭과 키보드 입력이 AI의 학습 데이터가 된다

AWS 환경에서 안전하게 쓰는 Claude Cowork, 전사 도입 가속화

AI가 찾아낸 보안 결함의 파도, Firefox가 Mythos로 271개 취약점 선제 대응

AI 코딩의 미래 SDD, 100명 규모 엔터프라이즈에서도 통할까?

OpenAI 샘 알트만, 앤스로픽 Mythos 모델에 직격탄 "공포 마케팅일 뿐"

AI의 거짓말, 알고 보니 인간의 뇌 구조를 닮았다?

AI 에이전트 7개에게 각각 100달러를 주고 12주간 방치한 결과

Claude Code 터미널에서 진짜 DOOM이 돌아간다? MCP로 구현한 놀라운 프로젝트

클라우드 토큰 낭비 끝! Git 작업을 로컬 LLM으로 처리하는 MCP 서버

단순 채팅 코딩은 끝났다? 명세만 던지면 AI가 알아서 완성하는 Traycer Bart Mode

RAG 성능의 핵심은 검색 알고리즘이 아닌 데이터 수집 파이프라인이다

Claude vs Codex 코딩 대결: 성능은 2배 빠르고 비용은 절반?

AI 모델 내부의 기하학적 질서: 233번의 실험으로 증명된 세 가지 밴드 구조

Claude Code가 유료 플랜에서 빠진다? Anthropic의 새로운 요금제 테스트

코드 리뷰의 종말? 이제 '구문'이 아닌 '의도'를 리뷰하는 시대

여러 AI 모델이 동시에 같은 가짜 숫자를? 집단 환각 현상 목격담

2026년 살아남은 AI 도구는? 챗봇부터 코딩 에이전트까지 완벽 티어 정리

AI 에이전트 보안 사고 74%를 심볼릭 가드레일로 완벽 차단

LLM 검색 모델, 오타에는 강하지만 유의어 교체 공격에는 취약

쌍곡선 기하학으로 3D 장면 이해도 8.14%p 대폭 향상

복잡한 모델 없이 단일 CNN 블록만으로 시계열 이상 탐지 SOTA 달성

세션이 끝나도 잊지 않는 AI, 연속성 계층으로 구현

LLM 에이전트 벤치마크의 15% 이상이 보상 해킹에 취약함이 밝혀졌다

LLM 에이전트의 도구 호출 정확도, 과거 대화 분석으로 80배 효율적 개선

Intel NPU에서 LLM 추론 속도 35% 향상 및 에너지 40% 절감

세포 편집의 성공 여부, 기하학적 일관성 지표 Shesha로 예측한다

데이터 부족한 사이버 보안 현장에서 취약점 활동 10일 앞서 예측

MNAFT, 특정 뉴런만 골라 학습시켜 이미지 번역 성능 SOTA 달성

과학 연구 에이전트의 진화, MLE-Bench에서 성능 316% 향상 달성

의료 AI의 맹점: 배경 노이즈만으로 오진을 유도하는 MedFocusLeak 공격

Shesha 지표로 LLM 조종 가능성 예측 및 드리프트 탐지 2배 개선

한 번에 여러 공감 전략을 구사하는 AI, 정서적 지지 성공률 40% 달성

570만 개의 PubMed 데이터로 LLM의 의학적 결론 도출 능력 검증

OLLM은 텍스트보다 시각 정보를 더 믿는다: 모달리티 선호도 분석

LLM 디버깅의 함정: 테스트 통과율 76%에도 정밀도는 45% 미만

LLM 추론 속도 2.16배 향상, KV Cache 결손 문제 해결한 River-LLM

LLM의 의미론적 추론 능력 검증을 위한 SEMANTICQA 벤치마크 공개

멀티모달 LLM, 숫자 인식은 완벽해도 곱셈 연산은 0점에 가깝다

미세 조정 없이 뇌 신호로 이미지를 읽는 BrainCoDec 공개

게임에서 배운 전략으로 수학 문제까지 해결하는 STRATAGEM 기술 공개

보상 없이 스스로 진화하는 LLM 에이전트, 웹 성능 20% 향상

음성 에이전트의 진화, VoxMind로 작업 완료율 34%에서 74%로 급증

문맥 밀도 최적화로 에이전트 토큰 사용량 89.6% 절감 달성

3만 개의 올림피아드 난제 정복, AI 수학 추론의 새로운 기준 MATHNET

구체적 단어 변조로 VLM의 구성적 이해 성능 13.13% 향상