此过程参考博客。
只记录和博客中有出入的地方。
5.1.2
博客nginx中该配置,参数$remote_addr
,如果直接复制到终端中可能会出现配置文件中$remote_addr
位置为空,终端会认为$remote_addr
是一个变量,而实际上是这是一个字符串输入到文件中。
9.1 方式一
配置完成后等待pod
执行,如果一直出现imagebackoffpull
等问题,可以使用命令kubectl describe pod <pod name> -n kube-system
查看具体报错,通常原因是拉取镜像失败。
可以手动拉取镜像,此时要注意,使用的containerd
容器运行时,k8s
默认会把镜像拉取到k8s.io
命名空间中,因此手动拉取时也需要拉取到这个命名空间中
1 | ctr -n k8s.io image pull <image_name> |
11.1.1
按照配置博客配置后如果出现metrics server无法访问
等错误,可以尝试在配置文件中添加参数
1 | hostNetwork: true |
本地调试scheduler
将远程环境中用户目录的
.kube
目录拷贝到本地windows
用户目录下。该目录下配置
clusters.cluster.server
配置是本机18443端口127.0.0.1:18443
将本地启动端口18443,与远程主机
192.168.217.100
连接登录然后将端口转发到127.0.0.1:8443
,相当于在远程主机本地访问集群ip和端口。1
ssh -L 18443:127.0.0.1:8443 -N -f root@192.168.217.100
1
2
3
4
5
6
7
8
9
10
11
12ssh -L localport:remotehost:remotehostport sshserver
说明:
localport 本机开启的端口号
remotehost 最终连接机器的IP地址
remotehostport 最终连接机器的端口号
sshserver 转发机器的IP地址
选项:
-f 后台启用
-N 不打开远程shell,处于等待状态(不加-N则直接登录进去)
-g 启用网关功能
安装kube-prometheus
https://cloud.tencent.com/developer/article/2216613
https://cloud-atlas.readthedocs.io/zh-cn/latest/kubernetes/monitor/prometheus/helm3_prometheus_grafana.html
网络问题是最主要的问题,可以多尝试几次。
启动pod
时拉取镜像中,kube-state-metrics
这个pod的镜像拉取最容易失败,即使手动拉取也非常容易失败。
可以参考链接采用其他的kube-state-metrics
安装,然后将拉取的镜像重新改名为上述需要的镜像。
访问相关页面:
alertmanager-main: 59.65.191.100:31675
grafana: 59.65.191.100:32657
prometheus-k8s: 59.65.191.100:32678
一直Terminating的解决办法
https://juejin.cn/post/7210020384044335165