k8s集群中存在大量pod状态为Terminating导致集群内应用服务异常
在工作问题处理时发现,K8s集群中存在大量的pod状态为Terminating,并且长期存在,导致airflow及其他部分服务因Terminating状态未自动修复。 kubectl get pod -n flowengine ![查看状态](http://static.51tbox.com/static/2024-11-18/col/e865d4ef80f4f57...
在工作问题处理时发现,K8s集群中存在大量的pod状态为Terminating,并且长期存在,导致airflow及其他部分服务因Terminating状态未自动修复。 kubectl get pod -n flowengine ![查看状态](http://static.51tbox.com/static/2024-11-18/col/e865d4ef80f4f57...
项目中存在2个网段的服务器,并且中间存在网络设备管理网络安全。在测试时发现跨网段访问部分节点的K8s内部服务IP不通,现象为service IP可以ping通但是无法TCP或UDP访问,POD ip无法ping也无法访问。 | 服务器网段 | |------------------| | 192.168.232.0/24 | | 192.168.223....
项目功能测试时发现k8s集群pod状态异常,node节点异常。 通过命令查看节点状态发现,有一台node状态为NotReady。 [root@loli-test1 ~]# kubectl get nodes NAME STATUS ROLES AGE VERSION 172.12.33.35 Ready ...
k8s自1.20版本开始,系统内核要求4.19及以上。如系统内核版本过低,请升级。 ### 基础环境配置 #### 检查唯一性 确保每个节点上 MAC 地址和 product_uuid 的唯一性。 * 您可以使用命令 `ip link` 或 `ifconfig -a` 来获取网络接口的 MAC 地址 * 可以使用 `sudo cat /sys/class/dmi/id/...
编辑docker配置文件设置socks5代理 ```lang-bash [root@master-all ~]# vim /usr/lib/systemd/system/docker.service [Service] Environment="ALL_PROXY=socks5://192.168.230.1:1080" ``` 修改完成保存后执行如下命...
在查看K8s系统组件时,发现`scheduler`及`controller-manager`组件状态存在异常,链接必要端口失败。 [root@cloud-master ~]# kubectl get cs Warning: v1 ComponentStatus is deprecated in v1.19+ NAME S...
公司产品基于K8s部署,在通过yaml编排启动对应容器时,发现POD一直处于Pending状态。 > 通常是由于pod的nodeSelector选择器未匹配节点所导致的,需要检查pod配置中定义的nodeSelector相关字段,确保能够与节点标签相匹配。 $ kubectl describe pod pod-xxx Warning FailedSch...
在部署k8s时,发现日志存在以下错误: [root@localhost ~]# kubectl logs -n kube-system kube-flannel-nlljz Error from server: Get "https://192.168.230.180:10250/containerLogs/kube-system/kube-fla...
在部署k8s时,存在报错 [root@localhost ~]# kubectl logs -n kube-system kube-flannel-nlljz I0821 08:50:35.175250 1 main.go:217] CLI flags config: {etcdEndpoints:http://127.0.0.1:4001,htt...
在部署完成k8s服务后,发现coredns组件状态存在异常,并且日志报错: [admin@localhost ~]$ kubectl logs --tail 20 -n kube-system coredns-68978987c9-gfq5h [INFO] plugin/reload: Running configuration MD5 = 2b18e8c07...