이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.
핵심 요약
Perceptron Inc.은 물리적 세계의 인과관계와 객체 역학을 이해하는 비디오 분석 추론 모델인 Mk1을 출시했다. 이 모델은 32K 컨텍스트 윈도우와 초당 2프레임 처리 능력을 갖추어 비디오의 시간적 연속성을 유지하며 물리적 상호작용을 추론한다. 기존 경쟁 모델 대비 80-90% 저렴한 비용으로 API를 제공하며, EmbSpatialBench와 VSI-Bench 등에서 우수한 성능을 입증했다. 물리적 AI를 지향하는 이 모델은 로봇 공학, 제조 품질 관리, 보안 감시 등 다양한 산업 분야에 적용 가능하다.
배경
Python 프로그래밍 기초, 비디오 데이터 처리 이해
대상 독자
물리적 AI 및 비디오 분석 솔루션을 도입하려는 기업 개발자
의미 / 영향
이 모델은 물리적 세계를 이해하는 AI의 비용 장벽을 획기적으로 낮춰 로봇 공학 및 산업 자동화 분야의 대규모 도입을 가속화할 전망이다. 특히 비디오 데이터의 시간적 연속성을 처리하는 능력은 실시간 감시 및 품질 관리 시스템의 효율성을 크게 향상시킬 것이다.
섹션별 상세
Mk1은 비디오를 개별 이미지 시퀀스가 아닌 시간적 연속성을 가진 데이터로 처리하여 객체 동일성을 유지한다. 물리적 법칙과 객체 역학을 이해하는 고정밀 공간 인식 능력을 갖추어 농구 슛의 성공 여부나 아날로그 시계 판독 등 복잡한 물리적 상호작용을 분석한다. 이 아키텍처는 로봇 공학이나 보안 감시와 같이 객체 가림(occlusion)이 발생하는 환경에서 필수적인 기능을 수행한다.
Mk1은 EmbSpatialBench에서 85.1점, VSI-Bench에서 88.5점을 기록하며 경쟁 모델 대비 높은 공간 및 시간적 추론 성능을 보였다. 특히 RefSpatialBench에서는 72.4점을 기록하여 GPT-5m(9.0)이나 Sonnet 4.5(2.2)를 큰 폭으로 앞섰다. 이러한 성능은 효율성 경계(Efficiency Frontier) 상에서 고성능 모델과 동등하거나 우월하면서도 Lite/Flash 모델 수준의 비용을 유지하는 독보적인 위치를 점한다.
API 비용은 입력 토큰 100만 개당 $0.15, 출력 토큰 100만 개당 $1.50으로 설정되어 기존 선도 모델 대비 80-90% 저렴하다. 함께 제공되는 Perceptron SDK는 Python 환경에서 Focus, Counting, In-Context Learning 기능을 지원하여 개발자가 최소한의 코드로 복잡한 비디오 분석 애플리케이션을 구축하도록 돕는다.
Perceptron은 폐쇄형 모델인 Mk1 외에도 오픈 가중치 모델인 Isaac 시리즈를 유지한다. 20억 파라미터 규모의 Isaac 0.2-2b-preview는 엣지 디바이스와 저지연 환경에 최적화되어 있으며, 상업적 라이선스를 통해 기업 고객에게 온프레미스 배포 유연성을 제공한다.
실무 Takeaway
- 비디오 분석 모델 도입 시 시간적 연속성(temporal continuity)을 지원하는지 확인하여 객체 가림 상황에서도 정확한 추론이 가능한지 검토해야 한다.
- Perceptron Mk1과 같은 저비용 고성능 모델을 활용하면 기존 고가 API 대비 80-90%의 비용 절감과 함께 물리적 AI 애플리케이션의 대규모 배포가 가능하다.
- 엣지 환경이나 온프레미스 배포가 필요한 경우 Isaac 시리즈와 같은 오픈 가중치 모델을 선택하여 성능과 보안 요구사항을 동시에 충족할 수 있다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
원문 발행 2026. 05. 13.수집 2026. 05. 14.출처 타입 RSS
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.