原来都是crontab惹的祸(inode 100%处理解决),服务器系统差点重置了/呜呜呜

本文主要是介绍原来都是crontab惹的祸(inode 100%处理解决),服务器系统差点重置了/呜呜呜,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

当服务器一连串出现这些Authentication token manipulation error或passwd: gkr-pam: couldn’t update the login keyring password:或E303: Unable to open swap file for “[No Name]“, recovery impossible以及出现No space left on device的问题的解决方法

大家可不要小瞧linux磁盘根目录爆满哈,今天要交流的就是磁盘100%之后发现的后遗症,并成功解决。

背景

发现问题一

Authentication token manipulation error  (给用户更改密码的时候报错)

在这里插入图片描述

第二天又接到机房的电话,还是上次的那个磁盘100%的服务器,现在无法给账户更改密码,报错Authentication token manipulation error给账户更改密码,怀疑服务器还存在问题。如果还不清楚什么情况,还请看下我上一篇博客

接上一个博客:cpu负载4800,根目录磁盘100%,问题排查和解决

因为当时在开周例会,也没及时的响应这个问题,毕竟机房的大佬才是专业的,哈哈哈,好吧,真正原因是因为开会实在太忙,没来的及安排

发现问题二

passwd: gkr-pam: couldn’t update the login keyring password  (查看系统日志发现)

在这里插入图片描述

机房接着发聩说查看系统日志发现了passwd: gkr-pam: couldn’t update the login keyring password这个问题,当时自己的第一发应就是sudo提权是不是出现了问题呢,因为之前遇见过类似的问题(印象中),但是机房反馈说可以正常的sudo到超级管理员用户,因为当时在开会,也没到服务器上面验证,安排人员和机房进行对接问题,没想到爆出了更多的问题。

发现问题三

E303: Unable to open swap file for “[No Name]“, recovery impossible  (vim编辑/etc/passwd文件的报错)

在这里插入图片描述

不一会接到电话说,本来想对一下passwd和shadow文件的一致性的,但是vim /etc/passwd的时候报错无法open swap。
有点意思了哈,这台服务器也很久了,接连出现了这几个奇怪现象,安排继续排查问题,排查磁盘空间也是充足的,就是不知道问题出现在了哪里,当时已经商量着走变更方案重置linux系统了。

发现问题四

No space left on device   (创建文件的时候发现)

在这里插入图片描述

检查磁盘空间发现磁盘空间充足

在这里插入图片描述

好吧,是时候揪出真凶了

发现真凶

如果大家看了我上一个博客的时候就会发现一个问题,磁盘曾经达到过100%,这里大家就得注意下了,还有一个cpu4800+,也就是说磁盘满了,但是cpu还是在干活的,在加上和定时任务有关,磁盘明明很充足,但是还是报磁盘空间不足,那就只有一个情况了,那就是系统文件的indoe号已经满了

简单的介绍下inode号的作用

理解inode号只需要简单知道3点
第一、linux中每个文件都必须有一个inode,无论文件的大小。
第二、每个inode都有一个号码,操作系统用inode号码来识别不同的文件。
第三、inode号是有上限的,达到上限就没有indoe号分配就无法创建文件。

解决问题

检查inode号使用情况

命令:df -hi    h:人性化显示也就是加上单位方便观看,i:代表的就是展示inode号信息

在这里插入图片描述

查找原因

出现Indeo号用完磁盘没有用完,当前本人就知道一种情况了,那就是小文件太多,占用了大量的Indoe的号,事实呢也就这种情况
还有就是出现这种情况,小编遇见做多的也就是邮件服务里面,尤其是crontab定时任务,为什么这样说呢,看看下面小编的解释

原因分析
  • 想知道原因的话,那就的先来弄清楚定时任务的原理
  • crontable创建定时任务,
  • 如果定时任务脚本书写不规范,有回显也就是说定时任务执行完后会有结果输出,
  • 如果设定定时任务的用户当前在线,那么这些结果就会在屏幕上显示了出来给用户,
  • 但是如果配置定时任务的用户不在线,那crontab就会默认发邮件来通知当前用户。

那么问题来了
如果一个定时任务1分钟执行一次,那也就是说他会一分钟生成一个邮件文件(用户不在线的情况下),时间长了,那邮件文件的数量可想而知了,这也就是这个问题的原因了。

查看小文件

因为小编之前处理这个事情较多了,别问小编是通过什么命令,什么方法来查找小文件在哪里的,小编只能告诉大家,凭经验,速度是最快的,所以说咱们不怕问题,最可怕的就是发生问题后不及时整理。

小文件(crontab的邮箱文件路劲):/var/spool/postfix/maildrop				不建议大家直接ls查看,因为会把终端卡死掉的哈,除非有时间慢慢等他显示出来
检查小文件数量

在这里插入图片描述

清理小文件

小编是老手哈,清理前第一时间想到的是备份,但是吧,小编条件不允许,如果大家条件允许的话,还是要备份的,虽然知道这些文件没有什么用,但是还是要养成一个良好的随手习惯

这里还有一点需要大家注意的哈,就是不能直接cd到路径下面使用rm -rf *命令来进行删除

  • 为什么不能使用rm -rf *
  • 身为运维人员第一要考虑的是数据的安全可靠,如果你执行错目录了呢,那岂不是得不偿失
  • 会报错,小编也忘了报什么错,好像是名称太长之类的
  • 好吧,小编承认,这样太残暴,不敢执行
执行命令

在/var/spool/postfix/maildrop目录下,一定要检查好目录

# ls | rm -f    #因为文件太多会执行很慢#这里需要注意的是我没有使用-r参数,为什么呢,因为-r参数会对当下的目录执行清理操作的,咱们要清理的是文件,减小不必要的风险然后重新打开一个终端,不停的检查df -hi 来检查inode号是不是慢慢的空闲了出来

检查结果

在这里插入图片描述
当然看当前需要,小编这个是将inode号空闲出来了53%,就直接ctrl + c终止执行了,需要Inode的空闲多少还是看自己需求了

最后机房验证所有的功能都已经恢复正常,业务也验证了对业务没有影响,这里小编还是要提示一下,别看小编这样连续的操作,当然也是走了变更流程的哈。

结束语

工作就是积累这些一点一滴,努力加奋斗成就辉煌

这篇关于原来都是crontab惹的祸(inode 100%处理解决),服务器系统差点重置了/呜呜呜的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/417368

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

如何解决线上平台抽佣高 线下门店客流少的痛点!

目前,许多传统零售店铺正遭遇客源下降的难题。尽管广告推广能带来一定的客流,但其费用昂贵。鉴于此,众多零售商纷纷选择加入像美团、饿了么和抖音这样的大型在线平台,但这些平台的高佣金率导致了利润的大幅缩水。在这样的市场环境下,商家之间的合作网络逐渐成为一种有效的解决方案,通过资源和客户基础的共享,实现共同的利益增长。 以最近在上海兴起的一个跨行业合作平台为例,该平台融合了环保消费积分系统,在短

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、