本文主要是介绍精细化运维待处理工作,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1、基础监控:需梳理所有物理子系统以及设备是否均已纳入基础监控,近期需持续汇总各告警信息,通过 CPU、内存、存储空间等判断目前现有资源是否满足业务需求,是否需要扩啊。2、统一事件平台:需设置各系统维护期,后续投产发布、变更尽量在维护期内完成。3、日志平台:梳理各系统日志同步情况,如发现未完全同步,需尽快完成治理。确定日志己同步,需梳理系统本身的日志清理策略是否生效。4、应用监控:交易类型、监控指标等经常误告警需开始进行调整,不同时间段不同指标需要进行细化。5、知识库: 以三大件为基础,结合实际操作步骤,进行运维知识库制作,内容要求:服务启停、技术验证、业务验证、业务联系人、关键日志路径《或查询方案)、批处理查询方案数据库配置方案《 虚机)、数据库操作方案。6、批处理指标细化:各系统批处理渠道《鲁班、百川、自服务、定时任务),批处理开始时间、结束时间、批处理步骤《内容)、状态、异常时是否可跳过,影响范围。7、数据流梳理,以物理子系统为单元,梳理组内组外数据流向,纵向排列系统。8、业务流梳理,以主管业务部门为单元,梳理组内系统归属,横向排列系统。9、前期工作收尾:三大件、只读用户权限梳理、日志路径挂载 NAS 等
这篇关于精细化运维待处理工作的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!