핵심 요약
고비용 AI 모델 사용 시 캐싱과 경량 모델 조합으로 비용을 대폭 절감할 수 있으며, 데이터 기반의 UX 개선이 리텐션 확보의 핵심이다.
배경
AI 기반 칼로리 트래킹 앱 Amy의 출시 후 2개월간의 운영 성과와 기술적 개선 사항을 다룬다.
대상 독자
AI 서비스를 개발 중인 1인 개발자, 스타트업 창업자, 제품 관리자
의미 / 영향
AI 앱 개발 시 성능과 비용 사이의 균형을 맞추는 구체적인 아키텍처 사례를 제시한다. 특히 1인 개발자가 상용 수준의 수익성을 확보하기 위해 필요한 데이터 분석 역량과 기술적 최적화의 중요성을 보여준다.
챕터별 상세
00:43
주요 비즈니스 지표 공개
출시 2개월 만에 월간 반복 매출(MRR) $1,504를 달성했다. 현재 유료 구독자는 148명이며, 최근 28일간 총 매출은 $1,968를 기록했다. 초기에는 높은 AI 운영 비용으로 인해 수익성이 낮았으나, 기술적 최적화를 통해 지속 가능한 구조를 구축했다.
- •월간 반복 매출(MRR) $1,504 달성
- •유료 구독자 148명 확보
- •수익성 개선을 위한 AI 비용 최적화 필요성 확인
01:38
AI 운영 비용 절감 전략
월 $700에 달하던 AI 비용을 $221로 약 70% 절감했다. 검색과 복잡한 계산이 필요한 작업에는 Perplexity Sonar를 유지하되, 단순한 수량 편집 작업에는 비용이 저렴한 Gemini 2.5 Flash-Lite를 사용하도록 아키텍처를 분리했다. 또한 Supabase를 활용한 캐싱 시스템을 도입하여 사용자가 동일한 음식을 입력할 경우 API 호출 없이 기존 데이터를 반환하도록 구현했다.
- •Gemini 2.5 Flash-Lite 도입으로 단순 작업 비용 절감
- •Supabase 기반 캐싱 도입으로 API 호출 70% 감소
- •AI 운영 비용을 월 $700에서 $221로 대폭 축소
고성능 모델과 경량 모델을 작업의 복잡도에 따라 나누어 사용하는 하이브리드 접근 방식은 AI 서비스 운영 비용 최적화의 핵심이다.
03:47
신규 기능: 메뉴 스캔 도입
식당 메뉴판 사진을 찍으면 메뉴 항목을 자동으로 추출하는 기능을 추가했다. Gemini 2.5 Flash-Lite를 활용해 메뉴판의 텍스트와 설명을 구조화된 데이터로 변환하고, 사용자가 항목을 선택하면 즉시 칼로리를 계산한다. 음식 사진 촬영 기능보다 메뉴판의 텍스트 정보가 더 정확한 영양 정보를 제공하는 경우가 많아 사용자 만족도가 높다.
- •Gemini 2.5 Flash-Lite를 활용한 메뉴 텍스트 추출
- •메뉴판 사진 기반의 간편한 식사 기록 기능 구현
- •경쟁 앱과 차별화되는 고유 기능 확보
04:59
데이터 분석 도구 PostHog 활용
제품의 모든 지표를 PostHog를 통해 관리한다. 특히 LLM 분석 기능을 사용하여 모델별 호출 비용, 지연 시간(Latency), 에러율을 실시간으로 모니터링한다. 이를 통해 Gemini와 Perplexity의 비용 효율성을 비교 분석하고, 리텐션에 영향을 미치는 사용자 행동 데이터를 추적하여 의사결정에 반영한다.
- •PostHog LLM Analytics를 통한 모델 성능 및 비용 추적
- •사용자 행동 데이터 기반의 리텐션 분석
- •데이터 중심의 제품 개선 프로세스 구축
05:58
리텐션 개선을 위한 제품 업데이트
1주 차 리텐션을 8%에서 10.2%로 향상시켰다. 사진 촬영 후 설명을 직접 수정할 수 있는 편집 버튼을 추가하여 UX 마찰을 줄였다. 또한 체중 추적 기능과 진행 사진 저장 기능을 도입하여 사용자가 앱에 데이터를 축적하게 함으로써 전환 비용(Switching Cost)을 높였다. Apple Health와의 연동을 강화해 영양 성분 데이터를 양방향으로 동기화하고, 이미 기록된 식사에 대해서는 알림을 보내지 않는 스마트 알림 시스템을 구축했다.
- •사용자 피드백 기반의 UX 마찰 지점 제거
- •체중 및 사진 기록 기능을 통한 데이터 락인(Lock-in) 효과 창출
- •중복 알림 방지 등 스마트 알림 시스템 도입
전환 비용(Switching Cost)은 사용자가 다른 서비스로 옮길 때 발생하는 유무형의 손실을 의미하며, 데이터 축적은 이를 높이는 효과적인 방법이다.
실무 Takeaway
- 고성능 모델과 경량 모델을 작업 성격에 따라 분리하여 비용 효율을 극대화해야 한다.
- 사용자가 자주 입력하는 데이터는 DB에 캐싱하여 API 호출 횟수를 줄이는 것이 필수적이다.
- 리텐션 향상을 위해 사용자가 데이터를 앱에 축적하게 만드는 기능을 설계하여 전환 비용을 높여야 한다.
- 데이터 분석 도구를 활용해 모델별 비용과 사용자 행동을 정밀하게 추적해야 한다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료