Perceptron, 물리적 세계 이해하는 저비용 비디오 추론 모델 'Mk1' 출시

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

Perceptron Inc.은 물리적 세계의 인과관계와 객체 역학을 이해하는 비디오 분석 추론 모델인 Mk1을 출시했다. 이 모델은 32K 컨텍스트 윈도우와 초당 2프레임 처리 능력을 갖추어 비디오의 시간적 연속성을 유지하며 물리적 상호작용을 추론한다. 기존 경쟁 모델 대비 80-90% 저렴한 비용으로 API를 제공하며, EmbSpatialBench와 VSI-Bench 등에서 우수한 성능을 입증했다. 물리적 AI를 지향하는 이 모델은 로봇 공학, 제조 품질 관리, 보안 감시 등 다양한 산업 분야에 적용 가능하다.

배경

Python 프로그래밍 기초, 비디오 데이터 처리 이해

대상 독자

물리적 AI 및 비디오 분석 솔루션을 도입하려는 기업 개발자

의미 / 영향

이 모델은 물리적 세계를 이해하는 AI의 비용 장벽을 획기적으로 낮춰 로봇 공학 및 산업 자동화 분야의 대규모 도입을 가속화할 전망이다. 특히 비디오 데이터의 시간적 연속성을 처리하는 능력은 실시간 감시 및 품질 관리 시스템의 효율성을 크게 향상시킬 것이다.

섹션별 상세

Mk1은 비디오를 개별 이미지 시퀀스가 아닌 시간적 연속성을 가진 데이터로 처리하여 객체 동일성을 유지한다. 물리적 법칙과 객체 역학을 이해하는 고정밀 공간 인식 능력을 갖추어 농구 슛의 성공 여부나 아날로그 시계 판독 등 복잡한 물리적 상호작용을 분석한다. 이 아키텍처는 로봇 공학이나 보안 감시와 같이 객체 가림(occlusion)이 발생하는 환경에서 필수적인 기능을 수행한다.

Mk1은 EmbSpatialBench에서 85.1점, VSI-Bench에서 88.5점을 기록하며 경쟁 모델 대비 높은 공간 및 시간적 추론 성능을 보였다. 특히 RefSpatialBench에서는 72.4점을 기록하여 GPT-5m(9.0)이나 Sonnet 4.5(2.2)를 큰 폭으로 앞섰다. 이러한 성능은 효율성 경계(Efficiency Frontier) 상에서 고성능 모델과 동등하거나 우월하면서도 Lite/Flash 모델 수준의 비용을 유지하는 독보적인 위치를 점한다.

근거

EmbSpatialBench에서 85.1점을 기록하여 Google의 Robotics-ER 1.5(78.4)를 상회했다. — Performance across spatial and video benchmarks 섹션

API 비용은 입력 토큰 100만 개당 $0.15, 출력 토큰 100만 개당 $1.50으로 설정되어 기존 선도 모델 대비 80-90% 저렴하다. 함께 제공되는 Perceptron SDK는 Python 환경에서 Focus, Counting, In-Context Learning 기능을 지원하여 개발자가 최소한의 코드로 복잡한 비디오 분석 애플리케이션을 구축하도록 돕는다.

근거

Mk1 API 비용은 입력 $0.15, 출력 $1.50/1M 토큰으로 경쟁 모델 대비 80-90% 저렴하다. — Market positioning and the efficiency frontier 섹션

Perceptron은 폐쇄형 모델인 Mk1 외에도 오픈 가중치 모델인 Isaac 시리즈를 유지한다. 20억 파라미터 규모의 Isaac 0.2-2b-preview는 엣지 디바이스와 저지연 환경에 최적화되어 있으며, 상업적 라이선스를 통해 기업 고객에게 온프레미스 배포 유연성을 제공한다.

기술

Perceptron Mk1
Isaac 0.2-2b-preview
Python
Perceptron SDK

활용 사례

로봇 공학
제조 품질 관리
보안 감시
콘텐츠 모더레이션
스포츠 하이라이트 자동 생성

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

배경

Python 프로그래밍 기초, 비디오 데이터 처리 이해

대상 독자

물리적 AI 및 비디오 분석 솔루션을 도입하려는 기업 개발자

의미 / 영향

섹션별 상세

근거

EmbSpatialBench에서 85.1점을 기록하여 Google의 Robotics-ER 1.5(78.4)를 상회했다. — Performance across spatial and video benchmarks 섹션

근거

Mk1 API 비용은 입력 $0.15, 출력 $1.50/1M 토큰으로 경쟁 모델 대비 80-90% 저렴하다. — Market positioning and the efficiency frontier 섹션

기술

Perceptron Mk1
Isaac 0.2-2b-preview
Python
Perceptron SDK

활용 사례

로봇 공학
제조 품질 관리
보안 감시
콘텐츠 모더레이션
스포츠 하이라이트 자동 생성

Perceptron, 물리적 세계 이해하는 저비용 비디오 추론 모델 'Mk1' 출시

TL;DR

배경

대상 독자

의미 / 영향

섹션별 상세

기술

활용 사례

Perceptron, 물리적 세계 이해하는 저비용 비디오 추론 모델 'Mk1' 출시

TL;DR

배경

대상 독자

의미 / 영향

섹션별 상세

기술

활용 사례

관련 토론

댓글

관련 기사

OpenAI Sora: 비디오 생성 AI의 새로운 시대

SmolVLM2-2.2B는 단일 소비자 GPU에서 실행 가능하면서 실무에 유용한 비디오 요약을 생성하는 2.2B 규모 모델

관련 토론

댓글

관련 기사

OpenAI Sora: 비디오 생성 AI의 새로운 시대

SmolVLM2-2.2B는 단일 소비자 GPU에서 실행 가능하면서 실무에 유용한 비디오 요약을 생성하는 2.2B 규모 모델