集群部署
将 DB-GPT 部署为分布式集群,将 webserver、model worker 和 controller 拆分开来,以提升扩展性。
架构概览
| 组件 | 角色 | 默认端口 |
|---|---|---|
| Controller | 服务注册与路由 | 8000 |
| LLM Worker | 提供语言模型服务 | 8001+ |
| Embedding Worker | 提供 Embedding 模型服务 | 8003+ |
| Reranker Worker | 提供重排模型服务 | 8004+ |
| API Server | REST API 网关(可选) | 8100 |
| Webserver | Web UI 与应用逻辑 | 5670 |
方式 A:手动集群部署(CLI)
第一步:启动 controller
dbgpt start controller
Controller 默认监听 8000 端口。
第二步:启动 LLM Worker
dbgpt start worker \
--model_name glm-4-9b-chat \
--model_path /app/models/glm-4-9b-chat \
--port 8001 \
--controller_addr http://127.0.0.1:8000
你也可以在不同端口上启动更多 worker:
dbgpt start worker \
--model_name vicuna-13b-v1.5 \
--model_path /app/models/vicuna-13b-v1.5 \
--port 8002 \
--controller_addr http://127.0.0.1:8000
信息
请将模型名称和路径替换为你自己的配置。每个 worker 都必须使用唯一端口。
第三步:启动 Embedding Worker
dbgpt start worker \
--model_name text2vec \
--model_path /app/models/text2vec-large-chinese \
--worker_type text2vec \
--port 8003 \
--controller_addr http://127.0.0.1:8000
第四步:启动 Reranker Worker(可选)
dbgpt start worker \
--worker_type text2vec \
--rerank \
--model_name bge-reranker-base \
--model_path /app/models/bge-reranker-base \
--port 8004 \
--controller_addr http://127.0.0.1:8000