服务案例|CIS数据库故障问题

2023-12-26 18:12

文章标签 问题服务数据库案例故障 cis

本文主要是介绍服务案例|CIS数据库故障问题，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一、告警通知

12月20日凌晨，平台收到某三甲医院告警通知，显示核心业务CIS系统数据库tempdb实例日志文件剩余空间不足。

查看告警详情页，显示tempbd日志文件使用率在凌晨1:30后异常增高。

一个小tip

tempdb是SQL Server实例的系统数据库，同时也是实例中的一个临时共享资源。当服务器重启，Tempdb将被重建，所以Tempdb是没有办法像其他数据库一样永久保存数据的。也就是说，Tempdb是一个临时的数据库，是为实例中的各种请求处理中间数据的，任务处理完会自动释放，不会占用内存。

二、问题处理

MOC通知现场工程师，告知SQL server的tempdb实例日志文件异常增长，使用率已达99%，即将满，可能会导致临时表无法创建或数据事务无法提交，需要联系数据工程师处理。

由于是tempdb日志文件问题，未引起数据工程师足够重视，并未及时处理，告警问题一直持续。

问题持续到下午16:30分，临近工程师下班点，MOC工程师观察到数据库服务器C盘数据量与tempdb的日志文件大小同步增加，tempdb的日志文件从0增长到28.52G, 无独有偶，服务器C盘可用空间从45G下降至12G。Tempdb的日志文件大小仍在增加，按照增长趋势估算，将在夜间23-24点，CIS服务器的C盘空间会满，可能会导致CIS系统瘫痪。CIS系统是医院的核心系统，一旦发生宕机现象，将造成难以估量的损失。

简言之，同步增长的数据将导致C盘爆满，以此趋势看，不出意外将在夜间凌晨发生宕机事件。

MOC沟通用户工程师，建议在下班前处理不断增长的tempdb日志文件数据。不是夜间宕机解决不了，而是现在处理更有性价比。

数据工程师得知夜间C盘将爆满，可能引发宕机事件，马上进行处理，停止了SQL server正在进行的作业任务，将tempdb日志文件大小进行收缩，释放C盘空间，告警问题解决。

三、问题小结

tempdb是一个临时的数据库，为实例中的各种请求处理中间数据。一般在任务处理完成后会自动释放，所以平台告警通知数据工程师后，并未引起足够重视。LinkSLA在线工程师持续跟进问题，发现tempdp日志文件数据持续不断增长，导致操作系统磁盘空间不足，在平台趋势测算下，夜间将会引发CIS系统瘫痪。

所谓善战者，无赫赫之功，运维就是如此，不担大风险，积小胜为大胜。在细节处着手，于萌芽处扼杀，不因低级别事件就不重视，小问题拖延或聚集，也会造成系统性宕机的大事件。

系统正常运行，是所有硬件资源在系统指令下协作完成，做到全面数据监控，实时自动巡检，能够及时地发现问题，积极响应问题，主动御防，精准解除。

LinkSLA管家式运维服务

LinkSLA智能运维管家不仅仅是工具，还实质性地参与用户主动式预防的运维过程。

1、 7*24 在线值守

moc工程师实时在线监测平台告警信息，经过筛查和初步定位后生成工单通知用户工程师；工单处理闭环，既降低用户工程师的工作量，也过滤了无效告警和工单。

▲7*24在线，工单闭环

2、全栈监控

实现设备、系统软件、应用软件、安全日志的统一监控。

▲全栈监控

3、机器学习算法，实现精准告警。

区别于传统静态阈值的告警算法，机器学习算法经过历史数据训练，发现业务运行常态中的异常，大大提高告警准确性。

▲AI机器学习算法告警详情

4、实时巡检，精准探测系统实时状态。

这篇关于服务案例|CIS数据库故障问题的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/540372。 23002807@qq.com

相关文章

SpringBoot基于配置实现短信服务策略的动态切换

SpringBoot基于配置实现短信服务策略的动态切换

《SpringBoot基于配置实现短信服务策略的动态切换》这篇文章主要为大家详细介绍了SpringBoot在接入多个短信服务商（如阿里云、腾讯云、华为云）后,如何根据配置或环境切换使用不同的服务商,需... 目录目标功能示例配置（application.yml）配置类绑定短信发送策略接口示例：阿里云 & 腾

阅读更多...

关于MongoDB图片URL存储异常问题以及解决

关于MongoDB图片URL存储异常问题以及解决

《关于MongoDB图片URL存储异常问题以及解决》：本文主要介绍关于MongoDB图片URL存储异常问题以及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录MongoDB图片URL存储异常问题项目场景问题描述原因分析解决方案预防措施js总结MongoDB图

阅读更多...

SpringBoot项目中报错The field screenShot exceeds its maximum permitted size of 1048576 bytes.的问题及解决

SpringBoot项目中报错The field screenShot exceeds its maximum permitted size of 1048576 bytes.的问题及解决

《SpringBoot项目中报错ThefieldscreenShotexceedsitsmaximumpermittedsizeof1048576bytes.的问题及解决》这篇文章... 目录项目场景问题描述原因分析解决方案总结项目场景javascript提示：项目相关背景：项目场景：基于Spring

阅读更多...

Python Transformers库(NLP处理库)案例代码讲解

Python Transformers库(NLP处理库)案例代码讲解

《PythonTransformers库(NLP处理库)案例代码讲解》本文介绍transformers库的全面讲解,包含基础知识、高级用法、案例代码及学习路径,内容经过组织,适合不同阶段的学习者,对... 目录一、基础知识1. Transformers 库简介2. 安装与环境配置3. 快速上手示例二、核心模

阅读更多...

解决Maven项目idea找不到本地仓库jar包问题以及使用mvn install:install-file

解决Maven项目idea找不到本地仓库jar包问题以及使用mvn install:install-file

《解决Maven项目idea找不到本地仓库jar包问题以及使用mvninstall:install-file》：本文主要介绍解决Maven项目idea找不到本地仓库jar包问题以及使用mvnin... 目录Maven项目idea找不到本地仓库jar包以及使用mvn install:install-file基

阅读更多...

usb接口驱动异常问题常用解决方案

usb接口驱动异常问题常用解决方案

《usb接口驱动异常问题常用解决方案》当遇到USB接口驱动异常时，可以通过多种方法来解决，其中主要就包括重装USB控制器、禁用USB选择性暂停设置、更新或安装新的主板驱动等... usb接口驱动异常怎么办，USB接口驱动异常是常见问题，通常由驱动损坏、系统更新冲突、硬件故障或电源管理设置导致。以下是常用解决

阅读更多...

Mysql如何解决死锁问题

Mysql如何解决死锁问题

《Mysql如何解决死锁问题》：本文主要介绍Mysql如何解决死锁问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录【一】mysql中锁分类和加锁情况【1】按锁的粒度分类全局锁表级锁行级锁【2】按锁的模式分类【二】加锁方式的影响因素【三】Mysql的死锁情况【1

阅读更多...

springboot项目如何开启https服务

springboot项目如何开启https服务

《springboot项目如何开启https服务》：本文主要介绍springboot项目如何开启https服务方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录springboot项目开启https服务1. 生成SSL证书密钥库使用keytool生成自签名证书将

阅读更多...

SpringBoot内嵌Tomcat临时目录问题及解决

SpringBoot内嵌Tomcat临时目录问题及解决

《SpringBoot内嵌Tomcat临时目录问题及解决》：本文主要介绍SpringBoot内嵌Tomcat临时目录问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录SprinjavascriptgBoot内嵌Tomcat临时目录问题1.背景2.方案3.代码中配置t

阅读更多...

SpringBoot使用GZIP压缩反回数据问题

SpringBoot使用GZIP压缩反回数据问题

《SpringBoot使用GZIP压缩反回数据问题》：本文主要介绍SpringBoot使用GZIP压缩反回数据问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录SpringBoot使用GZIP压缩反回数据1、初识gzip2、gzip是什么，可以干什么？3、Spr

阅读更多...