비동기 AI 작업
LLM API 호출의 느린 응답 속도와 예측 불가능성을 해결하기 위해 사용자 요청과 분리하여 백그라운드에서 처리하는 방식이다. 큐 시스템을 활용해 작업을 관리하며, 이를 통해 사용자 UI의 응답성을 유지하고 API 타임아웃 문제를 방지하며 자동 재시도 메커니즘을 구현할 수 있다.