부하 분산
여러 대의 서버나 백엔드에 작업을 나누어 처리 효율을 높이고 시스템 안정성을 확보하는 메커니즘이다.
확장 가능한 AI 시스템 설계, 이 10개 저장소면 충분합니다
50MB RAM으로 로컬 LLM 여러 대를 하나처럼 관리하는 Olla