浪潮信息内存故障预警技术再升级 服务器稳定性再获提升

本文主要是介绍浪潮信息内存故障预警技术再升级 服务器稳定性再获提升,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

浪潮信息近日对其内存故障智能预警修复技术进行了全面升级,再次取得技术突破。此次升级后,公司服务器的宕机率实现了80%锐降,再次彰显了浪潮信息在服务器技术领域的卓越能力。

浪潮信息全新升级服务器内存故障智能预警修复技术MUPR® (Memory UCE Prevent and Repair),基于对上万台服务器故障数据的建模分析和AI模型算法的训练,围绕“预诊愈”核心技术手段,从单端预警,触发隔离防护升级为BIOS、BMC两级防护,从内存故障提前预警、内存错误实时隔离、内存故障智能修复等技术层级创新,实现在架构设计、错误类型、防护等级等方面全面增强。全天候、多方位监测服务器内存健康状态,精准预测UCE(不可纠正错误)故障,及时处理内存风险单元,使由内存故障导致的服务器宕机风险降低80%+,保障客户业务高效稳定运行。

浪潮信息全新内存故障智能预警修复技术MUPR®拥有超过20项核心专利,覆盖内存故障处理策略、防护系统架构设计、内存健康监控机制等关键技术,能够有效规避内存UCE故障的发生,切实保障服务器内存运行的可靠性和高效性。

在这里插入图片描述

专利一:制定“点、线、面”故障修复策略,故障类型全面覆盖
MUPR®依据内存历史日志的错误发生模式,以存储单元的核心构造为基石,实时监测内存“点、线、面”微观故障,高效匹配内存UCE发生状态特征。首先实施内存物理结构微观级别的精准检测,深入至每一个内存Cell的状态识别,通过分析内存错误数据提取故障规则,保障内存“点”故障的准确辨识。其次,MUPR®系统对上万条来自不同品牌、不同容量的内存进行了详尽的故障分析。基于对不同内存厂家器件的行/列结构差异的分析,构建内存“线”故障预测模型。最后,依托对内存历史错误的UCE趋向性以及错误在内存阵列的分布情况,设置内存“面”故障模型,在线精准预测及修复策略,为用户提供更加可靠和稳定的内存使用体验。

专利二:优化内存防护系统架构,降低系统计算压力
MUPR®支持SMI(System Management Interrupt)与PRM(Platform Runtime Mechanism)的选项切换技术,引入PRM技术旨在降低系统计算压力,避免因处理内存故障而影响系统性能。该技术通过收集的内存错误信息进行带外故障预测,根据预测结果决定是否触发系统控制中断。而在触发中断的情况下,操作系统可通过PRM处理模块获取内存故障地址信息,并执行故障隔离操作,客户业务运行全程无打断。

专利三:实时监测内存运行状态,有效减少非计划宕机风险
鉴于任何防护措施都不能完全确保内存器件的持久稳定运行,MUPR®系统构建了一套完善的服务器内存健康监控和风险预警机制。该机制依据内存错误数量、频率、类型、修复状态、错误风暴、温度变化等多方面信息进行内存可靠性评价、性能评价,以便客户在不同业务场景下选择性的对可靠性或性能异常的内存进行计划停机维护,有效规避非计划宕机带来的影响。此外,该技术可有效对内存健康情况进行评测,并根据内存健康度分数对内存异常进行预警,当内存分数低于异常阈值,提示用户及时更换健康硬件。

MUPR®技术开发团队,通过对云数据中心130万台服务器进行综合测评,整体服务器宕机率减少了68%,可帮助客户避免千万美元级别以上的损失。
借助全新内存故障智能预警修复技术MUPR®,浪潮信息成功将内存故障预警与修复技术提升到一个全新的高度。该技术不仅实现了对内存故障的深度预警和精准修复,更在保障服务器稳定运行的同时,有效降低了由内存故障导致的业务中断风险,进一步提升了客户的业务连续性和稳定性。

这篇关于浪潮信息内存故障预警技术再升级 服务器稳定性再获提升的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1067044

相关文章

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

NameNode内存生产配置

Hadoop2.x 系列,配置 NameNode 内存 NameNode 内存默认 2000m ,如果服务器内存 4G , NameNode 内存可以配置 3g 。在 hadoop-env.sh 文件中配置如下。 HADOOP_NAMENODE_OPTS=-Xmx3072m Hadoop3.x 系列,配置 Nam

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

Linux服务器Java启动脚本

Linux服务器Java启动脚本 1、初版2、优化版本3、常用脚本仓库 本文章介绍了如何在Linux服务器上执行Java并启动jar包, 通常我们会使用nohup直接启动,但是还是需要手动停止然后再次启动, 那如何更优雅的在服务器上启动jar包呢,让我们一起探讨一下吧。 1、初版 第一个版本是常用的做法,直接使用nohup后台启动jar包, 并将日志输出到当前文件夹n

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

系统架构设计师: 信息安全技术

简简单单 Online zuozuo: 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo :本心、输入输出、结果 简简单单 Online zuozuo : 文章目录 系统架构设计师: 信息安全技术前言信息安全的基本要素:信息安全的范围:安全措施的目标:访问控制技术要素:访问控制包括:等保

macOS升级后SVN升级

问题 svn: error: The subversion command line tools are no longer provided by Xcode. 解决 sudo chown -R $(whoami) /usr/local/Cellar brew install svn