51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

kubesphere

k8s 节点 CPU 升级,导致 kubelet 无法启动故障一例

k8s 节点 CPU 升级,导致 kubelet 无法启动故障一例

厉飞雨 阅读(386) 评论(0) 赞(16)

<h1>事件背景</h1> <p>大家都知道 k8s 容量不够的时候,都是添加节点来解决问题。这几天有小伙伴在升级 k8s 容量的时候碰到一个问题,他将集群中某一个 node 节点的 CPU 做了升级,然后重启了这个 node 节点导致 kubelet 无法启动,然后大量 pod 被驱逐,报警电话响个不停。为了紧急恢复业务,果断参加故障恢复。...

K8S 管理平台 Rancher 部署实践

K8S 管理平台 Rancher 部署实践

厉飞雨 阅读(381) 评论(0) 赞(16)

<h2>一、概述</h2> <blockquote> <p><em>前面我们编排了很多 chart 包,需要一个管理平台来管理,所以这里介绍一款非常简洁和实用的管理平台 Rancher;Rancher 是一个 Kubernetes 管理工具,Rancher 基于 Kubernetes 添加了新的功能,包括统一所有集群的...

K8S master 节点更换 IP 与高可用故障模拟实战

K8S master 节点更换 IP 与高可用故障模拟实战

厉飞雨 阅读(515) 评论(0) 赞(16)

<h2>一、前言</h2> <blockquote> <p><em>根据小伙伴提的问题,这里专门出一篇文章分析 master 节点挂了不可用的场景分析,希望这篇文章对小伙伴有用;其实 VIP 的方案实现高可用,还有更可靠的方案,也是我们目前生成环境在使用的高可用方案,后面也会分享出来,请小伙伴耐心等待~</em&...

K8S节点CPU升级,导致kubelet无法启动排障

K8S节点CPU升级,导致kubelet无法启动排障

厉飞雨 阅读(458) 评论(0) 赞(16)

事情背后的景象 ======= k8s容量的时候时候时候,都都添加节点来问题。。这这几几几几天升级升级升级升级升级升级升级升级升级升级升级容量容量容量容量的时候时候碰到碰到个个了这个节点节点导致kubelet无法启动,然后大量pod被驱赶,报警电话响个不停。为了紧急救援,结果参与故障掩护。 现状获得 ==== 在知道,我后了了已经重启完毕的的的节点节点节点,开始节点,开始...

一款k8s实时错误监控工具

一款k8s实时错误监控工具

厉飞雨 阅读(330) 评论(0) 赞(19)

大家好,我是小碗汤,今天为大家分享一款k8s集群错误监控工具: Kubiquity **Kubiquity** ^\[1\]^ 是一个基于 Electron 的 Kubernetes 健康监控应用程序。它结合了 Kubernetes 命令行工具和 Prometheus 指标服务器,以从集群中获取实时信息。用户可以通过实时跟踪每个集群的事件日志历史以及 CPU 和内存使用情况来...

Devtron:强大的 K8S 软件交付工作流程

Devtron:强大的 K8S 软件交付工作流程

厉飞雨 阅读(494) 评论(0) 赞(14)

本文我们从讨论架构类型开始,然后开始介绍工具,比如为什么在这一步需要这个工具。然后来到 Devtron 部分配置,将部署一个 NodeJS 应用程序,以便能够看到 Devtron 如何使我们的工作更轻松。 大多数情况下,当构建应用程序时都有两种架构,可以在之上开发完整的应用程序。 1. 单体架构 2. 微服务架构 单体架构 ---- 如您所知,单体应用程序有一个庞大的代...

理清 K8S 网络排错

理清 K8S 网络排错

厉飞雨 阅读(293) 评论(0) 赞(13)

<h2><strong>Overview</strong></h2> <p>本文将引入一个思路:&quot;在 Kubernetes 集群发生网络异常时如何排查&quot;。文章将引入 Kubernetes 集群中网络排查的思路,包含网络异常模型,常用工具,并且提出一些案例以供学习。</p>...

详解 Flink 在 K8S 中的部署与实战操作

详解 Flink 在 K8S 中的部署与实战操作

厉飞雨 阅读(249) 评论(0) 赞(12)

<h2>一、概述</h2> <blockquote> <p>Flink 核心是一个流式的数据流执行引擎,并且能够基于同一个 Flink 运行时,提供支持流处理和批处理两种类型应用。其针对数据流的分布式计算提供了数据分布,数据通信及容错机制等功能。</p> </blockquote> <p>Fli...