2026년 7월 4일 AI 뉴스 아카이브

Roboflow Vision Evals의 67개 프롬프트에서 Claude Sonnet 5는 47개(70%)를 통과하여 Sonnet 4.6과 동률을 기록했고 문서 이해와 객체 계수에서 약점을 드러냈다.

코드·모델·환경·입력·부하·모니터 등 6개 축을 순서대로 점검해 원인을 특정하고 불필요한 디버깅을 줄인다.

작성자가 Claude 모델과 Network Rail API를 이용해 실시간 위치 추적과 플랫폼 예측 기능을 갖춘 개인용 앱 Live Rail을 개발했으며 예측 엔진의 정확도는 약 75%이다.

Meta의 Astryx와 Claude Code를 결합하여 AI 특유의 투박함을 제거하고 전문적인 웹사이트를 구축하는 실전 워크플로우를 소개한다.

PyTorch 테스트는 import 시 장치와 dtype별로 동적 생성되어 CI에 다른 이름으로 보고될 수 있으며 pytest -k와 test/run_test.py로 로컬 재현이 빠르다.