2026년 3월 8일 AI 뉴스 아카이브

Meta Newsroom

메타, 부모가 자녀의 AI 대화 주제를 확인하는 새로운 감독 기능 공개

메타가 부모가 자녀의 Meta AI 사용 주제를 모니터링하고 안전한 대화를 유도할 수 있는 인사이트 탭과 전문가 자문 위원회를 도입했다.

HF Community Blogs

단 21B 파라미터로 거대 모델급 성능, 텐센트의 Hy3 Preview 공개

텐센트가 295B 전체 파라미터 중 21B만 활성화하여 효율성을 극대화하고 추론 및 코딩 성능을 대폭 개선한 MoE 기반 Hy3 Preview 모델을 발표했습니다.

IBM Technology Companies Libraries

Docker 대신 Podman? 보안과 효율을 잡는 5가지 혁신 기능

Podman은 루트리스 실행과 데몬리스 구조를 바탕으로 systemd 통합, Kubernetes YAML 생성, 부팅 가능 컨테이너 등 개발 효율을 극대화하는 5가지 핵심 기능을 제공한다.

IBMKubernetesPodman

Practical AI

신발 브랜드 올버즈가 AI 인프라 기업으로? 네오클라우드 트렌드 분석

신발 브랜드 올버즈의 AI 컴퓨팅 인프라 기업 전환 사례를 통해 GPU 중심의 특화 클라우드인 네오클라우드 시장의 급성장과 업계 변화를 분석합니다.

No Priors (a16z)

40만 기업의 운영체제 SAP가 AI 시대를 준비하는 방법

SAP의 CTO Philipp Herzig가 엔터프라이즈 환경에서의 AI 도입 과제, 데이터 계층의 중요성, 그리고 AI 기반 비즈니스 프로세스 혁신 전략을 공유했다.

r/ClaudeCode

Claude Code의 한계를 넘는 방법: 코드와 1:1 매칭되는 섀도우 문서

AI 에이전트가 코드의 숨은 의도를 잊지 않도록 소스 파일과 1:1로 대응하는 마크다운 문서 트리를 구축하여 컨텍스트 손실 문제를 해결한 사례이다.

Hacker News - LLM

AI 에이전트의 한계 돌파: ragbits 1.6이 가져온 계획과 기억 능력

오픈소스 프레임워크 ragbits 1.6은 AI 에이전트가 복잡한 과업을 스스로 분할하고 실행 과정을 실시간으로 공유하며 세션 간 정보를 기억하는 기능을 추가했다.

Hacker News - LLM

LLM 성능의 핵심은 모델 가중치가 아닌 '외재화된 시스템'에 있다

LLM 에이전트의 발전을 모델 내부 가중치가 아닌 메모리, 스킬, 프로토콜 등 외부 인프라로 기능을 전이하는 '외재화' 관점에서 분석한 연구입니다.

r/PromptEngineering

프롬프트 버전 관리 실패로 인한 모델 오작동, 이렇게 해결했다

환경 간 시스템 프롬프트 불일치 문제를 해결하기 위해 버전 관리, 환경별 오버라이드, 롤백 기능을 포함한 구조적 관리 체계를 구축했다.

r/PromptEngineering

AI를 다루는 5가지 유형: 당신은 파수꾼인가 연금술사인가?

AI 활용 능력을 Sentinel, Architect 등 5가지 원형과 10개 클러스터로 분류하여 체계적인 학습 프레임워크를 제시했다.

r/MachineLearning Vision AI Libraries

사진보다 정확한 신체 측정 AI, 비결은 '물리 법칙'을 담은 손실 함수

8개의 설문 입력만으로 58가지 신체 파라미터를 정밀하게 예측하는 85KB 크기의 소형 MLP 모델과 물리 법칙을 통합한 손실 함수 설계 사례이다.

MHRPyTorchSAM 3D Body

r/artificial Language Models Libraries

기업용 AI 에이전트, 배포보다 관리가 더 큰 문제인 이유

기업 내 AI 에이전트가 급증하며 관리 주체와 지침을 파악하지 못하는 '혼돈의 단계'에 진입함에 따라 운영 거버넌스 도구의 필요성이 대두되었다.

ClaudeLangChainLangGraph

r/ClaudeCode Coding Agents

출근하자마자 업무 시작! Claude Code를 미리 깨워두는 자동화 팁

macOS의 pmset과 cron을 활용해 새벽에 Claude Code를 자동 실행하고 업무 컨텍스트를 미리 준비하는 워크플로이다.

Claude Code

100

쉽게 배우는 데이터와 AI

머신러닝의 기초, 회귀분석과 최소제곱법 완벽 이해하기

선형 회귀 분석의 핵심인 모델 구조, 최소제곱법 학습 원리, 결정계수를 통한 성능 평가 방법을 구체적인 사례와 함께 설명한다.

annotell Blog

자율 주행의 핵심, 1%의 희귀 데이터를 찾아내는 엣지 케이스 탐지 전략

자율 주행 시스템의 안전성을 높이기 위해 대규모 센서 데이터에서 희귀하고 복잡한 엣지 케이스를 효율적으로 탐지하고 주석을 달기 위한 4가지 핵심 방법론과 워크플로를 제시합니다.

r/vibecoding Coding Agents Dev Tools

Claude Pro 한계 느낀다면? 115개 AI 코딩 도구 가성비 순위 업데이트

115개 AI 코딩 도구의 무료 티어 지속 시간을 비교 분석한 웹사이트에 GLM 코딩 플랜과 교육용 기능 필터가 새롭게 추가됐다.

Claude CodeCursorv0

r/vibecoding

단 두 번의 프롬프트로 완성한 브라우저 저장형 스티키 메모

LLM 프롬프트를 통해 브라우저 로컬 스토리지를 활용한 데이터 영속성을 갖춘 스티키 메모 웹 UI를 구현했다.

Qdrant Vector DB

벡터 DB를 블랙박스처럼 쓰지 마세요: Qdrant 에이전트 스킬 도입 가이드

Qdrant가 도입한 Agent Skills는 벡터 검색의 엔지니어링 지식을 구조화하여 AI 에이전트가 스스로 검색 품질과 성능을 최적화하도록 돕는 프레임워크이다.

Qdrant

r/deeplearning

KNN의 핵심 원리부터 차원의 저주까지 시각적으로 마스터하기

K-최근접 이웃(KNN) 알고리즘의 거리 척도, K 선택, 정규화, 결정 경계 등 핵심 개념을 시각적으로 분석한 교육 자료이다.

r/deeplearning

GPT-2 1.5B 모델까지 직접 학습하며 확인한 스케일링 법칙

작성자가 GPT-2 모델을 124M부터 1.5B 파라미터까지 직접 구현하고 학습하며 얻은 최적화 노하우와 스케일링 법칙 데이터를 공유했다.

r/MachineLearning Benchmarks

소형 모델을 언제 돌릴까? 비용 최적화 LLM 스케줄링 챌린지

MMLU 벤치마크를 기반으로 소형 모델 실행 여부를 결정하여 전체 토큰 비용과 페널티를 최소화하는 Kaggle 경진대회가 개최됐다.

MMLU

r/artificial Language Models

텍스트 스캔 대신 모델 내부를 읽어 프롬프트 주입 92% 차단

모델의 내부 잔차 스트림을 분석하여 텍스트 분류 방식보다 높은 정확도로 프롬프트 주입을 탐지하는 Arc Sentry가 공개됐다.

LlamaMistralQwen

CMU AI News

로봇과 인간의 공존을 앞당긴다: 후지쯔-CMU 피지컬 AI 연구 센터 출범

후지쯔와 CMU가 실세계 상호작용을 위한 피지컬 AI 핵심 기술 연구 및 사회적 구현을 목표로 공동 연구 센터를 설립했다.

Latent Space (swyx)

구글 TPU v8과 Qwen 3.6 등장, AI 에이전트 시대의 새로운 표준

구글의 8세대 TPU 발표와 Qwen 3.6-27B 모델 출시를 중심으로, AI 에이전트 플랫폼 경쟁과 효율적인 토큰 사용 전략인 'Tokenmaxxing' 트렌드를 다룹니다.

Chase AI

Claude Code를 나만의 AI 운영체제로 만드는 4단계 아키텍처

Claude Code의 한계를 극복하기 위해 메모리, 스킬 라이브러리, 자동화 레이어, 대시보드 UI를 결합한 에이전트 OS 설계 방법론을 제시한다.

r/LLMDevs Libraries Language Models

A40 GPU로 구현한 100만 토큰 컨텍스트와 71개의 확장 도구 활용기

A40 GPU 환경에서 Qwen 모델을 기반으로 1M 컨텍스트 윈도우를 구현하고 도구 사용 기능을 71개로 확장하여 고성능 추론 시스템을 구축했다.

OpenVikingQwen

TechCrunch AI

일론 머스크의 승부수: 테슬라, AI와 휴머노이드 로봇에 250억 달러 쏟아붓는다

테슬라가 AI 인프라와 옵티머스 로봇 양산을 위해 2026년 자본 지출을 250억 달러로 대폭 늘리며 AI 기업으로의 전환을 가속화한다.

Augment Code Blog

코딩 에이전트 성능을 30% 좌우하는 AGENTS.md 작성법

Augment Code 팀이 수십 개의 AGENTS.md 파일을 분석하여 코딩 에이전트의 성능을 극대화하는 문서화 패턴과 함정을 공개했다.

160

Stanford Online Architecture

Transformer의 모든 것: 스탠포드 전문가가 짚어주는 AI의 과거와 미래

Transformer 아키텍처의 핵심 원리부터 사전 학습 전략, RAG, 에이전트 및 최신 연구 트렌드까지 포괄적으로 다루는 스탠포드 대학의 AI 세미나 강의이다.

Transformer

Stanford Online Architecture

Yann LeCun의 JEPA가 그리는 미래: 픽셀을 그리지 않고 세상을 이해하는 AI

Stanford CS25 세미나에서 발표된 이 영상은 픽셀 재구성 대신 잠재 공간에서의 예측을 통해 효율적이고 인과적인 세계 모델을 구축하는 JEPA 아키텍처와 최신 연구 사례를 다룬다.

JEPA

TechCrunch AI

X, Grok AI로 내 취향 저격하는 75개 맞춤형 피드 만든다

X가 Grok AI를 활용해 75개 이상의 특정 주제를 실시간으로 분류하고 개인화된 피드로 제공하는 '맞춤형 타임라인' 기능을 프리미엄 사용자에게 출시했다.

2026년 3월 8일 AI 뉴스

메타, 부모가 자녀의 AI 대화 주제를 확인하는 새로운 감독 기능 공개

단 21B 파라미터로 거대 모델급 성능, 텐센트의 Hy3 Preview 공개

Docker 대신 Podman? 보안과 효율을 잡는 5가지 혁신 기능

신발 브랜드 올버즈가 AI 인프라 기업으로? 네오클라우드 트렌드 분석

40만 기업의 운영체제 SAP가 AI 시대를 준비하는 방법

Claude Code의 한계를 넘는 방법: 코드와 1:1 매칭되는 섀도우 문서

AI 에이전트의 한계 돌파: ragbits 1.6이 가져온 계획과 기억 능력

LLM 성능의 핵심은 모델 가중치가 아닌 '외재화된 시스템'에 있다

프롬프트 버전 관리 실패로 인한 모델 오작동, 이렇게 해결했다

AI를 다루는 5가지 유형: 당신은 파수꾼인가 연금술사인가?

사진보다 정확한 신체 측정 AI, 비결은 '물리 법칙'을 담은 손실 함수

기업용 AI 에이전트, 배포보다 관리가 더 큰 문제인 이유

출근하자마자 업무 시작! Claude Code를 미리 깨워두는 자동화 팁

머신러닝의 기초, 회귀분석과 최소제곱법 완벽 이해하기

자율 주행의 핵심, 1%의 희귀 데이터를 찾아내는 엣지 케이스 탐지 전략

Claude Pro 한계 느낀다면? 115개 AI 코딩 도구 가성비 순위 업데이트

단 두 번의 프롬프트로 완성한 브라우저 저장형 스티키 메모

벡터 DB를 블랙박스처럼 쓰지 마세요: Qdrant 에이전트 스킬 도입 가이드

KNN의 핵심 원리부터 차원의 저주까지 시각적으로 마스터하기

GPT-2 1.5B 모델까지 직접 학습하며 확인한 스케일링 법칙

소형 모델을 언제 돌릴까? 비용 최적화 LLM 스케줄링 챌린지

텍스트 스캔 대신 모델 내부를 읽어 프롬프트 주입 92% 차단

로봇과 인간의 공존을 앞당긴다: 후지쯔-CMU 피지컬 AI 연구 센터 출범

구글 TPU v8과 Qwen 3.6 등장, AI 에이전트 시대의 새로운 표준

Claude Code를 나만의 AI 운영체제로 만드는 4단계 아키텍처

A40 GPU로 구현한 100만 토큰 컨텍스트와 71개의 확장 도구 활용기

일론 머스크의 승부수: 테슬라, AI와 휴머노이드 로봇에 250억 달러 쏟아붓는다

코딩 에이전트 성능을 30% 좌우하는 AGENTS.md 작성법

Transformer의 모든 것: 스탠포드 전문가가 짚어주는 AI의 과거와 미래

Yann LeCun의 JEPA가 그리는 미래: 픽셀을 그리지 않고 세상을 이해하는 AI

X, Grok AI로 내 취향 저격하는 75개 맞춤형 피드 만든다

스크린샷 한 장으로 게임 UI를 엔진용 에셋으로 자동 변환

인간은 80% 성공하지만 AI는 50% 미만인 시공간 추론 테스트

Vercel의 agent-browser보다 강력한 안티봇 우회 자동화 도구 등장

수천 개의 예시로 LLM 성능 극대화하기: Many-Shot ICL의 모든 것

오디오 전사 비용 90% 절감하기: NVIDIA Parakeet-TDT와 AWS Batch 활용 가이드

OpenAI의 차세대 모델 유출과 구글의 75% AI 자동 코딩 선언

데이터베이스의 난제 조인 최적화, LLM 에이전트로 성능 1.3배 향상

워런 의원의 경고: AI 부채와 불투명한 회계가 2008년식 금융 위기 부를 것

OpenAI의 새로운 에이전트, 슬랙 보고서 작성부터 이메일 발송까지 스스로 처리

건조한 문서 대신 YouTube 전사본을 넣었더니 AI 응답 품질이 폭발했다

모델마다 제각각인 벤치마크 순위, Train-before-Test로 해결한다

Claude Code 사용자 필수템? 맥북 노치에 숨어있는 AI 대시보드

Berkeley RDI 해커톤 1위 수상자가 공개하는 AI 코딩 에이전트 활용법

딥러닝 학습의 근본 원리, 공액 쌍대성 이론으로 풀다

당신의 웹사이트도 'AI 슬롭'인가요? 500개 사이트 전수 조사 결과

어제 하던 일을 기억하는 AI 에이전트, AIPass 프레임워크 공개

EfficientNet 기반 시각 모듈로 정확도 96% 달성 및 임베딩 성능 공유

트랜스포머를 넘어선 새로운 대안? 지속적 상태 전이 아키텍처 CTNet

삭제해도 소용없다? 법원이 판결한 AI 대화의 법적 증거 능력

구글 워크스페이스, Gemini 통합으로 데이터 입력 9배 빨라진다

CoT가 오히려 독? 시각 공간 추론에서 성능 3% 하락 확인

추론 시간을 늘렸더니 정확도가 하락? DAO 보안을 위협하는 '인지적 붕괴' 발견

신경망에서 정수 데이터를 직접 예측하는 새로운 이산 분포 Dalap 제안

PSRD: LLaVA-1.5의 시각적 환각 발생률을 50%까지 대폭 감소

8M 파라미터 초소형 모델로 클라우드 LLM의 지연 시간을 완벽히 은폐

LLM으로 LASSO 알고리즘 속도 2배 향상 및 양자 회로 오버헤드 24.5% 절감

AI 에이전트 간 보안 협업을 실현하는 ClawNet 프레임워크 공개

LLM은 왜 틀릴까? 대조적 기여도 분석으로 실패 원인 100% 규명

마이크로소프트, 하이브리드 범함수보다 정확한 딥러닝 기반 Skala 공개

LLM 최적화 성능의 핵심은 참신함이 아닌 로컬 리파인먼트 능력

이산 확산 모델에 RL 적용 성공, GenEval 정확도 69%에서 96%로 폭발적 향상

이미지 없이도 만점? MLLM 판사의 치명적 편향을 밝혀내다

파라미터 증가 없이 성능만 높이는 루프 스케일링 CTR 모델

단 13개 레이어만 학습시켜 Full LoRA 성능을 뛰어넘는 RDP LoRA

사용자 지시 없이도 AI가 사진의 결점을 스스로 판단해 보정한다

UniMesh, 3D 생성과 이해를 하나의 아키텍처로 통합 성공

LLM 내부 뉴런 0.12%만으로 학습 데이터 품질 결정한다

SDVG: 비디오 생성 속도 2.09배 향상 및 품질 98% 유지

CityRAG, 실제 도시 데이터로 3D 일관성을 갖춘 수 분 길이 비디오 생성

가중치 직교성 강제로 태스크 산술 성능 대폭 향상

다국어 AI 모델의 치명적 약점, '코드 스위칭'에서 성능 27% 급락

검색 모델의 지시어 이해도 45% 향상시키는 듀얼 뷰 학습법

단순 텍스트 비교를 넘어 환경과 상호작용하며 AI를 검증하는 AJ-Bench 공개

자연어만으로 Dify 워크플로 자동 생성, 에이전트 프레임워크로 성공률 5.34% 향상

LoRA의 한계 극복, 섀도우 네트워크로 LLM 튜닝 성능과 유연성 동시 확보

LLM의 GUI 코드 생성 한계 극복, PlayCoder로 실행 성공률 20.2% 향상

추론 중에도 똑똑해지는 LLM, TEMPO로 AIME 성능 23.5%p 폭증

YAML로 정의하는 LLM 에이전트 워크플로, 7개 벤치마크 성능 압도