지식 노동 벤치마크
OpenAI가 개발한 성능 측정 지표로, 스프레드시트 작성, 프레젠테이션 제작, 문서 분석 등 실제 비즈니스 환경에서 발생하는 지식 노동 작업의 성공률을 측정합니다. 모델이 얼마나 실질적인 경제적 가치를 창출할 수 있는지 평가하는 데 중점을 둡니다.
OpenAI가 도입한 앤스로픽의 스킬 방식, 에이전트 혁신의 열쇠가 될까?
엑셀과 파워포인트 장인이 된 AI? OpenAI가 공개한 업무 특화 모델 GPT-5.2