deepseek 70b光进行推理,显存要48GB,cpu要32core;32b进行推理,要求最小显存24GB,cpu 16 core。这种情况下,如果有多台8GB的显卡,是可以考虑上32b的。
找了很多工具,发现一款可用的gpustack,参考其安装文档(Quickstart - GPUStack),进行了如下实践:
一、规划了二台机器
1台windows工作站,GV100显卡,32GB显存;
1台windows笔记本,4060显卡,8GB显存;
二、安装
1、工作站
打开windows powershell,执行如下命令:
$env:INSTALL_INDEX_URL = "https://pypi.tuna.tsinghua.edu.cn/s