k8s 系统证书刷新

1. 查看当前证书情况:

# k8s 版本 1.15-1.18
sudo kubeadm alpha certs check-expiration
# k8s >=1.23
sudo kubeadm certs check-expiration


可以看到,证书已经过期了。会造成集群挂掉。
会有相关报错:
failed to verify client's certificate: x509: certificate has expired or is not yet valid
Unable to connect to the server: x509: certificate has expired or is not yet valid
– 6443 端口没有监听 等情况

2. 生成新的证书

# k8s 版本 1.15-1.18
sudo kubeadm alpha certs renew all
# k8s >=1.23
sudo kubeadm certs renew all

更新后,再查看证书的日期。就会发现已经刷新了一年。

3. 更新当前配置信息

cp /etc/kubernetes/admin.conf  ~/.kube/config
sudo systemctl restart kubelet

这样的话, kubectl 命令就又恢复了。

ps 查看kubelet的日志命令

journalctl -xefu kubelet

AMD GPU device plugin for Kubernetes on ubuntu 22.04 安装使用

AMD GPU device plugin for Kubernetes 是一个amd的k8s显卡插件。

环境说明:
+ ubuntu 22.04
+ k8s 1.23.9

安装amd的内核驱动

wget https://repo.radeon.com/amdgpu-install/22.20.3/ubuntu/jammy/amdgpu-install_22.20.50203-1_all.deb
sudo apt install ./amdgpu-install_22.20.50203-1_all.deb
sudo apt-get update
sudo amdgpu-install --usecase=dkms
# 安装完成后,必须重启一下
sudo reboot

浏览全部