浪潮信息内存故障预警技术再升级 服务器稳定性再获提升

本文主要是介绍浪潮信息内存故障预警技术再升级 服务器稳定性再获提升,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

浪潮信息近日对其内存故障智能预警修复技术进行了全面升级,再次取得技术突破。此次升级后,公司服务器的宕机率实现了80%锐降,再次彰显了浪潮信息在服务器技术领域的卓越能力。

浪潮信息全新升级服务器内存故障智能预警修复技术MUPR® (Memory UCE Prevent and Repair),基于对上万台服务器故障数据的建模分析和AI模型算法的训练,围绕“预诊愈”核心技术手段,从单端预警,触发隔离防护升级为BIOS、BMC两级防护,从内存故障提前预警、内存错误实时隔离、内存故障智能修复等技术层级创新,实现在架构设计、错误类型、防护等级等方面全面增强。全天候、多方位监测服务器内存健康状态,精准预测UCE(不可纠正错误)故障,及时处理内存风险单元,使由内存故障导致的服务器宕机风险降低80%+,保障客户业务高效稳定运行。

浪潮信息全新内存故障智能预警修复技术MUPR®拥有超过20项核心专利,覆盖内存故障处理策略、防护系统架构设计、内存健康监控机制等关键技术,能够有效规避内存UCE故障的发生,切实保障服务器内存运行的可靠性和高效性。

在这里插入图片描述

专利一:制定“点、线、面”故障修复策略,故障类型全面覆盖
MUPR®依据内存历史日志的错误发生模式,以存储单元的核心构造为基石,实时监测内存“点、线、面”微观故障,高效匹配内存UCE发生状态特征。首先实施内存物理结构微观级别的精准检测,深入至每一个内存Cell的状态识别,通过分析内存错误数据提取故障规则,保障内存“点”故障的准确辨识。其次,MUPR®系统对上万条来自不同品牌、不同容量的内存进行了详尽的故障分析。基于对不同内存厂家器件的行/列结构差异的分析,构建内存“线”故障预测模型。最后,依托对内存历史错误的UCE趋向性以及错误在内存阵列的分布情况,设置内存“面”故障模型,在线精准预测及修复策略,为用户提供更加可靠和稳定的内存使用体验。

专利二:优化内存防护系统架构,降低系统计算压力
MUPR®支持SMI(System Management Interrupt)与PRM(Platform Runtime Mechanism)的选项切换技术,引入PRM技术旨在降低系统计算压力,避免因处理内存故障而影响系统性能。该技术通过收集的内存错误信息进行带外故障预测,根据预测结果决定是否触发系统控制中断。而在触发中断的情况下,操作系统可通过PRM处理模块获取内存故障地址信息,并执行故障隔离操作,客户业务运行全程无打断。

专利三:实时监测内存运行状态,有效减少非计划宕机风险
鉴于任何防护措施都不能完全确保内存器件的持久稳定运行,MUPR®系统构建了一套完善的服务器内存健康监控和风险预警机制。该机制依据内存错误数量、频率、类型、修复状态、错误风暴、温度变化等多方面信息进行内存可靠性评价、性能评价,以便客户在不同业务场景下选择性的对可靠性或性能异常的内存进行计划停机维护,有效规避非计划宕机带来的影响。此外,该技术可有效对内存健康情况进行评测,并根据内存健康度分数对内存异常进行预警,当内存分数低于异常阈值,提示用户及时更换健康硬件。

MUPR®技术开发团队,通过对云数据中心130万台服务器进行综合测评,整体服务器宕机率减少了68%,可帮助客户避免千万美元级别以上的损失。
借助全新内存故障智能预警修复技术MUPR®,浪潮信息成功将内存故障预警与修复技术提升到一个全新的高度。该技术不仅实现了对内存故障的深度预警和精准修复,更在保障服务器稳定运行的同时,有效降低了由内存故障导致的业务中断风险,进一步提升了客户的业务连续性和稳定性。

这篇关于浪潮信息内存故障预警技术再升级 服务器稳定性再获提升的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1067044

相关文章

ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法

《ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法》本文介绍了Elasticsearch的基本概念,包括文档和字段、索引和映射,还详细描述了如何通过Docker... 目录1、ElasticSearch概念2、ElasticSearch、Kibana和IK分词器部署

部署Vue项目到服务器后404错误的原因及解决方案

《部署Vue项目到服务器后404错误的原因及解决方案》文章介绍了Vue项目部署步骤以及404错误的解决方案,部署步骤包括构建项目、上传文件、配置Web服务器、重启Nginx和访问域名,404错误通常是... 目录一、vue项目部署步骤二、404错误原因及解决方案错误场景原因分析解决方案一、Vue项目部署步骤

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

golang内存对齐的项目实践

《golang内存对齐的项目实践》本文主要介绍了golang内存对齐的项目实践,内存对齐不仅有助于提高内存访问效率,还确保了与硬件接口的兼容性,是Go语言编程中不可忽视的重要优化手段,下面就来介绍一下... 目录一、结构体中的字段顺序与内存对齐二、内存对齐的原理与规则三、调整结构体字段顺序优化内存对齐四、内

JavaWeb-WebSocket浏览器服务器双向通信方式

《JavaWeb-WebSocket浏览器服务器双向通信方式》文章介绍了WebSocket协议的工作原理和应用场景,包括与HTTP的对比,接着,详细介绍了如何在Java中使用WebSocket,包括配... 目录一、概述二、入门2.1 POM依赖2.2 编写配置类2.3 编写WebSocket服务2.4 浏

查询SQL Server数据库服务器IP地址的多种有效方法

《查询SQLServer数据库服务器IP地址的多种有效方法》作为数据库管理员或开发人员,了解如何查询SQLServer数据库服务器的IP地址是一项重要技能,本文将介绍几种简单而有效的方法,帮助你轻松... 目录使用T-SQL查询方法1:使用系统函数方法2:使用系统视图使用SQL Server Configu

nginx-rtmp-module构建流媒体直播服务器实战指南

《nginx-rtmp-module构建流媒体直播服务器实战指南》本文主要介绍了nginx-rtmp-module构建流媒体直播服务器实战指南,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. RTMP协议介绍与应用RTMP协议的原理RTMP协议的应用RTMP与现代流媒体技术的关系2

mysqld_multi在Linux服务器上运行多个MySQL实例

《mysqld_multi在Linux服务器上运行多个MySQL实例》在Linux系统上使用mysqld_multi来启动和管理多个MySQL实例是一种常见的做法,这种方式允许你在同一台机器上运行多个... 目录1. 安装mysql2. 配置文件示例配置文件3. 创建数据目录4. 启动和管理实例启动所有实例

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)