2026년 6월 20일 AI 뉴스 아카이브

Hacker News - LLM Prompting

TOON으로 토큰 30% 절감, Condensed Markdown로 입력 50% 감소

토큰 비용과 처리 속도를 줄이는 세 가지 프롬프트 최적화 기법(T O O N, 축약 마크다운, 멀티샷 예시)이 실전에서 비용 효율성과 품질을 동시에 개선한다.

Condensed MarkdownMulti-shot ExamplesTOON

AI Andy

15달러로 끝내는 고퀄리티 모션 그래픽, 어떤 오픈소스 도구가 가장 효율적일까?

GLM-5.2와 Claude Code를 사용하여 HyperFrames, Remotion, Revideo 라이브러리로 모션 그래픽을 제작하고 비용과 성능을 비교 분석한다.

Wired AI Products

Gemini 기반 Siri AI가 iPhone을 개인 비서로 재정의한다—WWDC 2026의 핵심

WWDC 2026에서 Apple은 Gemini로 작동하는 Siri AI를 iOS 27에 도입해 개인화와 프라이버시를 강화했고, 기기 데이터 인덱싱으로 맥락‑기반 대화를 가능하게 했다.

Siri AI

Hacker News - LLM Dev Tools

로컬에서 YAML 파이프라인으로 자동화를 구현하는 Stepyard의 실전 사용법

Stepyard는 로컬 머신에서 YAML 파이프라인을 실행하고 파이썬 플러그인으로 확장하는 자동화 러너이다.

Stepyard

ClearML Blog

AIMs로 AMD 인프라에서 프로덕션 추론의 부담을 줄이는 방법

AMD AIMs는 모델과 런타임을 포함한 컨테이너를 제공하고, ClearML은 운영 계층을 관리해 생산형 추론 엔드포인트를 간소화한다.

Artificial Intelligence

미드저니가 갑자기 초음파 스캐너를 만든다고? AI 업계 주간 이슈 총정리

미드저니의 하드웨어 시장 진출, 앤스로픽의 연방 금지 조치, AWS의 칩 판매 전략 등 AI 업계 주요 소식을 다룹니다.

The AI Daily Brief

AI 전략 수립에 매몰되지 마라: 기업이 진짜 구축해야 할 것은?

기업이 AI 도입을 위해 전략 수립보다 실질적인 AI 학습 시스템 구축과 운영 체계 마련에 집중해야 한다는 점을 강조한다.

MIT AI News Domain AI

모티프 기반 샘플링으로 금속 합금 예측 정확도 향상

정보 이론에 기반한 다양한 로컬 환경을 포괄하는 학습 데이터셋으로 금속 합금의 물성 예측을 더 정확하게 수행하는 ML 샘플링 접근법을 제시한다.

Metals

iMerit Blog

사람의 시연으로 로봇 손동작을 빠르게 배우는 데이터 파이프라인

사람 시연 데이터를 입력으로 받아 비전-촉각 멀티모달 정보를 통해 로봇의 손 제어 정책을 학습하고, 대규모 데이터 수집을 위한 비디오 리타게팅과 인터랙티브 학습 방법이 현장 적용에 중요함을 설명한다.

Techpresso

구글이 Nvidia의 재무 전략을 차용해 TPU 수요를 촉진하는 보증 파이낸싱

구글이 Nvidia의 금융 플레이북을 모방해 보증 기반 자금조달로 TPU 임대와 데이터센터 계약을 확대하는 전략을 채택했다.

Matt Wolfe Companies

Anthropic 모델 제재부터 자율주행 화장실까지, 이번 주 AI 핵심 뉴스 총정리

Anthropic 모델 제재, GLM-5.2 출시, Perplexity의 에이전트 메모리 개선 등 이번 주 주요 AI 기술 뉴스를 요약한다.

AnthropicMidjourneyOpenAI

딥러닝논문읽기모임

LLM 강화학습, 무작위 학습 대신 '적정 난이도' 문제만 골라 학습시켜 성능 극대화하기

VCRL은 강화학습 시 보상 분산이 높은 문제를 우선 선택하고 메모리 뱅크에 저장해 재학습함으로써 LLM의 수학 추론 성능을 효율적으로 향상시킨다.

TechCrunch AI

Reliance의 네트워크 내재형 AI로 전화통화와 가정 AI의 미래가 바뀐다

Reliance의 Jio Call Agent, MyJio AI, TeleFrame 등으로 AI를 네트워크 수준에 내재화해 전화 통화와 가정용 AI 경험을 확장한다.

Hacker News - LLM Libraries

Headroom으로 에이전트 컨텍스트를 압축해 토큰 비용을 대폭 줄인다

Headroom은 에이전트가 읽는 모든 도구 출력·로그·RAG 결과를 로컬에서 압축해 LLM에 전달하는 토큰 수를 크게 줄이되, 동일한 응답 품질을 유지한다.

Headroom

Hacker News - LLM Dev Tools

터미널에서 작동하는 로컬 LLM 코파일럿으로 문제를 즉시 진단하라

터미널 세션에 바로 통합되는 경량 LLM 코파일럿으로 로컬/클라우드 백엔드를 선택하고 컨텍스트를 기반으로 명령을 제안한다.

slash-agent

Hacker News - LLM Inference

WAN에서 실용 가능한 대형 모델 추론을 구현하는 Shard의 실전 연구

WAN 상의 다중 GPU 분산 인퍼런스에서 744B GLM-5.2를 파이프라인으로 처리하고, 추정 디코딩과 CUDA-그래프 드래프트로 처리량을 비약적으로 높이는 설계를 제시한다.

Shard

Hacker News - LLM

LLM의 핵심 원리를 밝히는 첫 걸음, 컨텍스트 윈도우와 KV 캐시의 비밀

LLM의 기본 구성요소인 뉴런과 파라미터에서 시작해 토큰화, 컨텍스트 윈도우, Transformer의 어텐션, KV 캐시에 이르는 작동 원리와 하드웨어 비용의 관계를 설명한다.