大数据运维之磁盘存储告警 排障实战
4A是指:认证Authentication、授权Authorization、账号Account、审计Audit,中文名称为统一安全管理平台解决方案
从告警短信里获取有用信息
①告警主机名:hadoop211
②告警目录:/xxx
核对告警是否属实
①在 4A 里登录任意一节点,比如 hadoop201。
②切换到 hadoop 用户
③远程到告警主机 hadoop216
④查看当前硬盘的被占用情况,发现/xxx 目录当前被占用律的确超过了 90%。
命令 df -h
查找体积最大的目录
进入/xxx 目录,执行命令 du -sm --max-depth=0 * 2> /dev/null | sort -nr
由此可知,bca 用户的目录产生了很多缓存文件和临时文件,是造成磁盘
被占用率高的原因
注:如果删除了 bca 的缓存后,发现磁盘占用率仍然高于 90%,可继续联
系第二高的目录 xxx 的接口人进行删除工作。以此类推。
确定负责删除工作的接口人
确定是否删除