truenas scale 中使用 nvidia grid 驱动（esxi中使用vpgu切割显卡给truenas）

By scjtqs | 2023年5月28日 - 下午1:05 |2023年5月28日 truenas scale | 访问次数： 3,963 次

背景

随着ai的大兴，和狂潮的结束，各种显卡都出来了。尤其是一些大显存的卡，像什么nvidia tesla p4 8G、 nvidia tesla P40 24G、nvidia tesla P100 16G 之类的纯计算卡，支持vgpu，可以一卡分配给多个系统使用。这里博主自己搞了块p4的半高刀卡显卡插到了我的超微x11sri-if上使用。

先要卸载官方原版的n卡驱动

apt remove nvidia-alternative
apt-get autoremove

安装grid的guest driver（宿主驱动在esxi上安装，这里就不说了）

# 这里选择了 15.2 的最新驱动 NVIDIA-Linux-x86_64-525.105.17-grid.run
chmod +x NVIDIA-Linux-x86_64-525.105.17-grid.run
./NVIDIA-Linux-x86_64-525.105.17-grid.run
# 如果想要卸载，使用 nvidia-uninstall 命令

禁用nouveau驱动

vi /etc/modprobe.d/blacklist-nouveau.conf
#添加
blacklist nouveau
options nouveau modeset=0

添加license 并重启

（这里就不细说了，见来自民间的 nvidia的 vgpu 授权服务 fastapi-dls）配置完license后，记得重启系统。

系统中的nvidia-docker已经默认安装，可以直接测试安装结果

sudo docker run --rm --gpus all nvidia/cuda:12.0.1-base-ubuntu22.04 nvidia-smi

打赏

Bookmark the permalink.

0 0 投票数

文章评分

订阅评论

2 评论

内联反馈

查看所有评论

Aron

1 年前

請問有24.10版的嗎

0

回复

作者

scjtqs

1 年前

回复给 Aron

zfs set readonly=off boot-pool/ROOT/24.10.2/usr

然后下载驱动到/usr/share/truenas/sysext-extensions目录并且重命名为nvidia.raw

curl -o /usr/share/truenas/sysext-extensions/nvidia.raw https://file.homelabproject.cc/d/foxipan/vGPU/16.5/NVIDIA-GRID-TrueNAS-SCALE-extensions-16.5.raw

1

回复

wpDiscuz
2
0
希望看到您的想法，请您发表评论x
()
x
| 回复