rate-limit
특정 시간 동안 API를 통해 보낼 수 있는 요청의 수나 토큰의 양을 제한하는 정책이다. 고성능 모델일수록 제한이 엄격한 경우가 많아, 효율적인 프롬프트 작성을 통해 요청 횟수를 최소화하는 것이 중요하다.
코딩 중 갑작스러운 속도 제한은 이제 그만, AI 계정 통합 관리 도구
3배 비싼 Opus 4.6이 오히려 돈을 아껴준다? 코딩 에이전트 실전 후기