Sonnet 5 비전 평가에서 70% 점수 기록
Roboflow Vision Evals의 67개 프롬프트에서 Claude Sonnet 5는 47개(70%)를 통과하여 Sonnet 4.6과 동률을 기록했고 문서 이해와 객체 계수에서 약점을 드러냈다.
총 5건
Roboflow Vision Evals의 67개 프롬프트에서 Claude Sonnet 5는 47개(70%)를 통과하여 Sonnet 4.6과 동률을 기록했고 문서 이해와 객체 계수에서 약점을 드러냈다.
코드·모델·환경·입력·부하·모니터 등 6개 축을 순서대로 점검해 원인을 특정하고 불필요한 디버깅을 줄인다.
작성자가 Claude 모델과 Network Rail API를 이용해 실시간 위치 추적과 플랫폼 예측 기능을 갖춘 개인용 앱 Live Rail을 개발했으며 예측 엔진의 정확도는 약 75%이다.
Meta의 Astryx와 Claude Code를 결합하여 AI 특유의 투박함을 제거하고 전문적인 웹사이트를 구축하는 실전 워크플로우를 소개한다.