OpenAI, GPT-5.4 Thinking의 새로운 앱 개발 및 컴퓨터 사용 능력 공개 | AI Trends

OpenAI, GPT-5.4 Thinking의 새로운 앱 개발 및 컴퓨터 사용 능력 공개

GPT-5.4 Thinking은 지속성 있는 컴퓨터 사용(CUA) 기능을 통해 토큰 효율을 높이고 이미지 입력만으로 완성도 높은 웹사이트를 자동으로 구축한다.

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

GPT-5.4 Thinking은 지속성 있는 CUA를 통해 토큰 사용량을 획기적으로 줄이면서도 복잡한 앱 개발과 시각적 검수를 자율적으로 수행한다. 이미지 시안을 실제 작동하는 웹사이트로 변환하고 스스로 결과물을 검증하는 워크플로우를 구현했다.

배경

OpenAI의 연구원 SQ Mah가 웹 및 앱 개발에 최적화된 GPT-5.4 Thinking 모델의 새로운 기능을 소개한다.

대상 독자

AI 개발자, 소프트웨어 엔지니어, UI/UX 디자이너

의미 / 영향

개발자가 환경 설정이나 단순 코딩에 들이는 시간을 획기적으로 줄여준다. 특히 시각적 요소를 코드로 변환하고 검증하는 과정이 자동화되어 비전문가의 웹 제작 진입장벽이 낮아질 것이다. 지속성 있는 CUA는 LLM 기반 에이전트의 운영 비용 문제를 해결하는 중요한 기술적 진보이다.

챕터별 상세

00:00

GPT-5.4 Thinking과 새로운 개발 역량

웹 및 앱 개발 환경에서 모델이 자신의 작업을 스스로 검토하는 능력이 강화됐다. GPT-5.4 Thinking은 지속성 있는 CUA(Computer Use)와 이미지 입력을 활용한 웹사이트 제작이라는 두 가지 핵심 기능을 제공한다. 기존 Codex 모델과 달리 새로운 환경을 매번 구축할 필요 없이 사용자와 유사한 방식으로 컴퓨터와 상호작용한다.

00:31

지속성 있는 CUA를 활용한 3D 체스 앱 개발

3D 체스 게임을 제작할 때 별도의 샌드박스 환경을 매번 구축하지 않고 기존 세션을 유지하는 지속성 있는 CUA를 사용했다. 이 방식은 모델이 자신의 작업을 테스트하는 과정에서 발생하는 토큰 사용량을 기존 대비 3분의 2 수준으로 절감했다. 모델은 Playwright를 사용하여 Electron 앱 내의 체스 규칙인 캐슬링(Castling)과 앙파상(En Passant) 등이 정상 작동하는지 직접 클릭하며 검증했다.

CUA(Computer Use)는 모델이 API 호출을 넘어 실제 운영체제의 인터페이스를 조작하고 브라우저나 앱을 실행하는 기술이다.

01:55

이미지 기반 웹사이트 자동 생성 및 시각적 검수

사용자가 제공한 커피숍 디자인 이미지를 바탕으로 HTML/CSS 코드를 생성하고 ImageGen을 호출하여 적절한 에셋을 동시에 제작했다. 모델은 생성된 웹사이트와 원본 이미지를 나란히 띄워놓고 시각적으로 비교하며 차이점을 수정하는 자가 검수 과정을 거쳤다. 이 과정에서 여러 장의 이미지를 병렬로 생성하여 전체 제작 시간을 단축했다.

실무 Takeaway

CUA의 지속성(Persistence)을 활용하면 모델이 환경을 매번 재설정할 필요가 없어 토큰 비용을 60% 이상 절감할 수 있다.
이미지 입력과 ImageGen의 결합을 통해 디자인 시안만으로 실제 작동하는 프론트엔드 코드와 에셋을 일괄 생성하는 워크플로우가 가능하다.
모델이 스스로 결과물을 시각적으로 검수(Self-check)하는 루프를 구축하여 개발 생산성을 극대화할 수 있다.

언급된 리소스

문서Playwright

AI 분석 전체 내용 보기

AI 요약 · 북마크 · 개인 피드 설정 — 무료

출처 · 인용 안내

원문 발행 2026. 03. 06.수집 2026. 03. 06.출처 타입 YOUTUBE

인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.