Home >> 【GPT】vicuna-33b-v1.3 部署测试

【GPT】vicuna-33b-v1.3 部署测试

2023-07-13 14:18 AtmosphereMao

vicuna-33b-v1.3

一、vicuna-33b-v1.3

大小约：63.5GB 二、部署测试
环境
- GPU：V100-32GB(32GB) * 1
- CPU：10 vCPU Intel Xeon Processor (Skylake, IBRS)
- 内存：72GB
  1. 部署过程


# 下载vicuna-33b-v1.3
git lfs install
git clone https://huggingface.co/lmsys/lmsys/vicuna-33b-v1.3
cd vicuna-33b-v1.3
git lfs pull

# 启动控制器

python -m fastchat.serve.controller --host 0.0.0.0

# 启动 model worker

python -m fastchat.serve.model\_worker --model-path /root/autodl-tmp/fastchat/vicuna-33b-v1.3 --host 0.0.0.0

# 8bit 使用 &amp;&amp; cpu卸载

python -m fastchat.serve.model\_worker --model-path /root/autodl-tmp/fastchat/vicuna-33b-v1.3 --load-8bit --cpu-offloading --host 0.0.0.0

# 最后启动webserver

python -m fastchat.serve.gradio\_web\_server --port 6006

# openai api 启动

python3 -m fastchat.serve.openai\_api\_server --host 0.0.0.0 --port 8001