【翻译】Full-System Power Analysis and Modeling for Server Environments【part2】

2024-01-29 15:48

本文主要是介绍【翻译】Full-System Power Analysis and Modeling for Server Environments【part2】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

接上一篇翻译博客

IV 评估


为了验证Mantis的功率建模方法,我们为刀片和Itanium服务器开发了Mantis模型,如上一节所述。 我们使用这些模型来估算运行各种应用程序的每个系统的功耗。 具体来说,我们使用了SPECcpu2000整数和浮点基准,SPECjbb2000,SPECweb2005,流基准和矩阵乘法。 总的来说,这代表了30多种不同的个人基准应用程序,涵盖了不同的计算领域(工作站,科学,企业),并强调了系统组件的不同子集。 所用应用程序的多样性对于模型的验证至关重要。 如果所有应用程序都来自单个域,则该模型可能缺少应用程序未执行的组件的关键参数。

图5.每个基准测试期间Mantis模型的平均误差。

图5显示了两个系统的模型预测精度。 总体而言,误差范围为0%至15%,刀片模型在所有情况下均实现小于5%的误差。

 

图6.两个系统模型的第90百分位误差。

图6显示了模型的时间精度。 在每个时间点,在预测和测量之间计算绝对误差,并且针对两个系统的每个基准报告所有样本的该误差的第90百分位数。 从图中可以看出,除了使用SPECcpu2000-int的Itanium模型外,所有情况下的误差都在10%以内。 这主要是由于Itanium处理器的VLIW-esque EPIC架构,OS报告的CPU利用率不考虑应用程序的ILP级别。 这些结果表明,Mantis不仅可以准确地预测基准测试中的总平均功率,而且在预测瞬时功耗方面也是准确的。

 

V Mantis的应用


在这里,我们讨论Mantis功率模型的应用。
A.工作负载内功率变化
特定于工作负载和特定于服务器的电源变化。
在内部工作负载级别,我们的结果表明许多应用程序的功率变化非常小。尽管偶尔存在功率“峰值”,但基于相位的功率行为与先前的研究表现出的相似。在工作负载级别,存在更多变化。刀片服务器在SPECcpu-fp和SPECweb之间显示出近50%的变化。同样令人感兴趣的是高端系统和低端系统之间的功率变化。以前大多数关于服务器电源的直觉都将所有服务器集中在一个类别中。我们的分析表明,除了绝对功率的差异之外,不同类别的服务器之间的瓶颈性质和功率趋势的变化存在根本差异。同样,这激发了像Mantis这样的在线工具,可以在运行时基础上准确地捕获每个系统的功率变化。
B.运行时供应和控制电力和热量
Mantis的实时功耗模型还可用于插入动态控制算法,用于电源和热量管理。下面,我们定性地讨论一些例子。
在线电力和热力管理。实时组件级电源故障的可用性可以实现一些有趣的电源管理优化。例如,PowerShifting [12]试图通过动态重新配置处理器和内存组件之间的功率预算来限制总功率预算。使用像Mantis这样的模型,这种方法可以更加准确,并扩展到系统的所有其他组件。 Mantis还可以启用新的优化。例如,当前的方法主要集中在p态转换或电压缩放以降低功率。通常,CPU利用率的变化可以产生类似的功率节省,而不会受到不同状态之间转换的影响,但这些节省在不同系统中会有所不同(通常以非直观的方式)。 Mantis可用于提供运行时校准,以节省可能的功耗,同时降低CPU利用率与更改功率状态。 

Mantis实现的另一个有趣的优化是动态控制风扇速度以响应系统剩余的功耗。 目前,风扇功率在整个工作负载的执行中是恒定且不变的。 但是,Mantis的组件级功耗见解可用于有选择地打开单个风扇,以便更好地将冷却资源引导到最需要它们的区域。 从Itanium服务器结果可以看出,风扇功率是总功率中不断增长的组成部分,这样的优化可以显着节省服务器总功耗。

集群和数据中心环境中的TCO感知资源配置。 Mantis可以扩展到单个服务器之外,以在更广泛的系统级别上实现优化。 Mantis的一个有趣的应用是预测数据中心的“热图”。热图可识别房间中各个服务器入口的温度,并用于指导优化以控制数据中心级别的冷却成本。目前确定热图的方法涉及昂贵的外部传感器部署以捕获温度。然而,像Mantis这样的捕获服务器产生的热量的方法,与成为标准的板载每服务器温度传感器一起使用,现在可用于为外部传感器提供代理。除了降低成本之外,这种方法还可以提供对数据中心级热优化的更快和同步响应,例如[19]中讨论的那些。

Mantis在数据中心级别实现资源配置以降低总体拥有成本(TCO)的另一个好处。这一点尤其重要,因为最近有迹象表明电力成本可能超过数据中心的硬件成本[4]。 Mantis可用于有效地提供每服务器,每机架,每解决方案级别的电力成本估算。与每个机架或配电单元(PDU)部署电流表的传统方法相比,这种方法可以提供更低的成本,更精细的粒度以及与工作负载行为的更好关联。

进一步扩展,随着公用计算环境开始基于性能保证以及功率和热量影响提供资源[19],[18],像Mantis这样的模型现在可用于提供资源的“反向计算”可以用于给定的功率预算,以及功率调度决策如何影响性能。这实现了整体TCO感知资源供应优化,否则这是不可能的。

VI 相关工作
据我们所知,Mantis在提供动态全系统功率特性方面是独一无二的,它是操作系统级资源利用率和通用性能计数器指标的函数。 SimplePower [26],Soft-Watt [14]和Mambo [23]提供全系统功率估算,但这些研究使用与仿真系统中的低级架构事件相关的分析模型与相应的速度和便携性方面的缺点。这些框架很难用于电源管理的在线应用。在组件级功率建模方面也做了大量工作。 Wattch [7]是一种广泛使用的CPU功率模型,它试图精确地模拟微处理器中阵列结构,导线和时钟消耗的能量。内存[22],磁盘[29]和网络[27]也有其他类似的模型。虽然这些模型提供了单个组件功率的详细预测,但它们通常是与耗时的仿真系统一起使用的离线模型。因此,它们难以用于在线电源管理或分析需要太长时间来模拟的大型商业工作量。

使用实时系统事件可以解决其中的一些问题缺点。 Bellosa是最早提出事件驱动能源会计概念的人之一[5]。这项工作和其他相关研究[6],[28]探讨了使用性能计数器来提供实际系统的动态功率表征。但是,单独使用性能监视计数器可能非常不准确,因为大多数处理器只允许测量有限数量的并发计数器读数。时间复用[15],[16]可以解决这个问题,但代价是一些覆盖范围的损失。此外,处理器计数器无法洞察I / O系统(磁盘和网络)。 Cignetti等[9]使用系统调用来指示不同硬件设备的状态转换以测量功率。我们的工作利用了对这一工作主体的类似观察,但使用的直觉是,在大多数实际应用中,操作系统级资源利用率指标也可以为功耗提供良好的一阶代理,并补充一些所有当前处理器架构上可用的选定性能计数器,可提供良好的准确性。

 

VII 结论


由于功耗是当前和未来计算机系统的主要限制因素,越来越多的研究侧重于调度器中的功率优化或功率感知系统架构的开发。 然而,很多这项工作取决于系统在运行时所消耗的功率的准确表征或测量,作为正在运行的工作负载和正在使用的资源的函数 - 遗憾的是,该区域没有受到太多关注。

在本文中,我们解决了社区的一个关键需求,即缺乏定量的实际测量数据,显示实际基准和系统的功率分解和变化。 利用允许我们测量各个电源层功耗的实验设置,我们研究了许多工作负载的总功耗和组件级功耗。

除了记录这些基准测试的功耗行为外,我们的结果还说明了未来工作的几个潜在缺陷和机会。 具体来说,我们的结果表明,不加选择地使用铭牌等级和功率计算器往往会导致错误的结论。 我们对组件功率随高级软件参数变化的变化进行了表征,这表明可以采用更高级别的建模方法,该方法可以提供具有复杂硬件支持的组件级功率分解。 虽然我们的刀片系统已经针对功率进行了很好的优化,但我们发现仍然有很多机会来优化非CPU组件(例如,内存)的功能。 我们的数据还表明,专注于提高平均案例效率的优化可能会带来更多好处。

我们提出了Mantis - 一种用于建模全系统功耗的非侵入式方法,可以轻松灵活地用于功率研究。 Mantis依赖于通过操作系统或标准硬件计数器收集的组件利用率指标。 在离线一次性校准阶段,通过合成工作负载单独强调组件,并创建模型以将组件利用率度量与测量的功率相关联。 然后将这些模型合并到Mantis中,以预测正常使用时的平均全系统功耗,而无需任何直接功率测量。

我们讨论Mantis模型的设计,重点关注系统主要组件的建模方法,以及两种不同类型服务器的实例化 - 低端刀片系统和高端计算服务器。为了验证模型,我们测量了这些系统的交流功耗,并比较了Mantis预测的结果。在包括SPECint,SPECfp,SPECweb,SPECjbb和其他应用程序(如流和矩阵乘法)的30多个基准测试中,Mantis占实际测量平均功率的10%以内。此外,我们对细粒度测量具有良好的准确性。随着功率和热量开始成为未来系统设计中的关键挑战之一,我们相信像Mantis这样的方法很可能成为未来功耗感知解决方案的关键组成部分。

在未来,随着密集服务器中电源管理的挑战变得越来越困难,提高系统功效的简单方法已经耗尽,考虑更激进的解决方案变得更加重要 - 跨越硬件和软件边界,系统这样的研究提供了帮助我们完善对问题的理解的第一步,希望能够使这些解决方案能够应对这一新兴的关键挑战,并进行机架边界,电力和冷却边界等。

 

REFERENCES

[1]  Information about the Linux/UNIX sar command. http://www.computerhope.com/unix/usar.htm.

[2]  Perfmon project. http://www.hpl.hp.com/research/linux/perfmon/.

[3]  ASHRAE Handbook. http://resourcecenter.ashrae.org/

store/ashrae/newstore.cgi?categoryid=146.

[4]  L. Barroso. The price of performance. ACM Queue, 3(7), September 2005.

[5]  F. Bellosa. The benefits of event-driven energy accounting in power-sensitive systems. In Proceedings of the 9th ACM SIGOPS European Workshop, Kolding, Denmark, Sept. 17–20 2000.

[6]  F. Bellosa. The case for event-driven energy accounting. Technical Report TR-I4-01-07, University of Erlangen, Department of Computer Science, June 29 2001.

[7] D. Brooks, V. Tiwari, and M. Martonosi. Wattch: A framework for architectural-level power analysis and optimizations. In Proceedings of the 27th International Symposium on Computer Architecture (ISCA), pages 83–94, June 2000.

[8] F. Chang, K. Farkas, and P. Ranganathan. Energy-driven statistical pro- filing detecting software hotspots. Workshop on Power-Aware Computer Systems, 2002.

[9] T. Cignetti, K. Komarov, and C. Ellis. Energy estimation tools for the Palm. In Proceedings of the ACM Modeling, Analysis and Simulation of Wireless and Mobile Systems (MSWiM), Aug. 2000.

[10] G. Cole. Estimating drive reliability in desktop computers and con- sumer electronics. Technology Paper TP-338.1, Seagate Technologies, November 2000.

[11] G. Contreras and M. Martonosi. Power prediction for intel xscale® processors using performance monitoring unit events. In ISLPED ’05: Proceedings of the 2005 international symposium on Low power electronics and design, pages 221–226, New York, NY, USA, 2005. ACM Press.

[12] W. Felter, K. Rajamani, T. Keller, and C. Rusu. A performance- conserving approach for reducing peak power consumption in server systems. In Proceedings of the 19th Annual International Conference on Supercomputing (ICS), pages 293–302, 2005.

[13] J. Flinn and M. Satyanarayanan. PowerScope: A tool for profiling the energy usage of mobile applications. In Second IEEE Workshop on Mobile Computing Systems and Applications, pages 2–10, Feb. 1999.

[14] S. Gurumurthi, A. Sivasubramaniam, M. J. Irwin, N. Vijaykrishnan, M. Kandemir, T. Li, and L. K. John. Using complete machine simulation for software power estimation: The SoftWatt approach. In Proceedings of the 8th International Symposium on High-Performance Computer Architecture (HPCA), page 141, Washington, DC, USA, 2002. IEEE Computer Society.

[15] R. Joseph and M. Martonosi. Run-time power estimation in high- performance microprocessors. International Symposium on Low-Power Electronics and Design (ISLPED), pages 135–140, 2001.

[16] I. Kadayif, T. Chinoda, M. Kandemir, N. Vijaykrishnan, M. J. Irwin, and A. Sivasubramaniam. vEC: Virtual energy counters. In Proceedings of the 2001 ACM SIGPLAN-SIGSOFT Workshop on Program Analysis for Software Tools and Engineering (PASTE), pages 28–31, New York, NY, USA, 2001. ACM Press.

[17] J. Moore. Gamut - Generic Application eMUlaTion, Dec. 2005. http://issg.cs.duke.edu/cod/.

[18] J. Moore, J. Chase, and P. Ranganathan. Weatherman: Automated, on- line, and predictive thermal mapping and management for data centers. To appear in the Third IEEE Conference on Autonomic Computing, June 2006.

[19] J. Moore, J. Chase, P. Ranganathan, and R. Sharma. Making scheduling ”cool”: Temperature-aware resource assignment in data centers. In Proceedings of the Usenix Annual Technical Conference, 2005.

[20] J. Mouton. Enabling the vision: Leading the architecture of the future. Keynote speech, Server Blade Summit 2004.

[21] C. D. Patel, C. E. Bash, R. Sharma, and M. Beitelmal. Smart cooling of data centers. In IPACK, July 2003.

[22] F. Rawson. MEMPOWER: A simple memory power analysis tool set, Jan. 2004. IBM Austin Research Laboratory.

[23] H. Shafi, P. J. Bohrer, J. Phelan, C. A. Rusu, and J. L. Peterson. Design and validation of a performance and power simulator for PowerPC systems. IBM Journal of Research and Development, 47(5-6):641–651, 2003.

[24] R. Sullivan. Alternating hot and cold aisles provides more reliable cooling for server farms, 2000. Uptime Institute.

[25] United States Environmental Protection Agency. EPA Con- ference on Enterprise Servers and Data Centers, Jan. 2006. http://www.sun.com/aboutsun/environment/epa.jsp.

[26] N. Vijaykrishnan, M. T. Kandemir, M. J. Irwin, H. S. Kim, and W. Ye. Energy-driven integrated hardware-software optimizations using SimplePower. In Proceedings of the 27th International Symposium on Computer Architecture ISCA, pages 95–106, 2000.

[27] H. Wang, X. Zhu, L. Peh, and S. Malik. Orion: A power-performance simulator for interconnection networks. In Proceedings of the 35th Annual International Symposium on Microarchitecture (MICRO), pages 294–305, Nov. 2002.

[28] A. Weissel and F. Bellosa. Process cruise control: Event-driven clock scaling for dynamic power management. In Proceedings of the In-

 

这篇关于【翻译】Full-System Power Analysis and Modeling for Server Environments【part2】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/657397

相关文章

SQL Server数据库磁盘满了的解决办法

《SQLServer数据库磁盘满了的解决办法》系统再正常运行,我还在操作中,突然发现接口报错,后续所有接口都报错了,一查日志发现说是数据库磁盘满了,所以本文记录了SQLServer数据库磁盘满了的解... 目录问题解决方法删除数据库日志设置数据库日志大小问题今http://www.chinasem.cn天发

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

Spark MLlib模型训练—聚类算法 PIC(Power Iteration Clustering)

Spark MLlib模型训练—聚类算法 PIC(Power Iteration Clustering) Power Iteration Clustering (PIC) 是一种基于图的聚类算法,用于在大规模数据集上进行高效的社区检测。PIC 算法的核心思想是通过迭代图的幂运算来发现数据中的潜在簇。该算法适用于处理大规模图数据,特别是在社交网络分析、推荐系统和生物信息学等领域具有广泛应用。Spa

Partical System

创建"粒子系统物体"(点击菜单GameObject -> Create Other -> Particle System) 添加"粒子系统组件"(点击Component -> Effects  ->Particle System) 粒子系统检视面板  点击粒子系统检视面板的右上角的"+"来增加新的模块。(Show All Modules:显示全部) 初始化模块: •

red5-server源码

red5-server源码:https://github.com/Red5/red5-server

小技巧绕过Sina Visitor System(新浪访客系统)

0x00 前言 一直以来,爬虫与反爬虫技术都时刻进行着博弈,而新浪微博作为一个数据大户更是在反爬虫上不遗余力。常规手段如验证码、封IP等等相信很多人都见识过…… 当然确实有需要的话可以通过新浪开放平台提供的API进行数据采集,但是普通开发者的权限比较低,限制也比较多。所以如果只是做一些简单的功能还是爬虫比较方便~ 应该是今年的早些时候,新浪引入了一个Sina Visitor Syst

UML- 统一建模语言(Unified Modeling Language)创建项目的序列图及类图

陈科肇 ============= 1.主要模型 在UML系统开发中有三个主要的模型: 功能模型:从用户的角度展示系统的功能,包括用例图。 对象模型:采用对象、属性、操作、关联等概念展示系统的结构和基础,包括类图、对象图、包图。 动态模型:展现系统的内部行为。 包括序列图、活动图、状态图。 因为要创建个人空间项目并不是一个很大的项目,我这里只须关注两种图的创建就可以了,而在开始创建UML图

excel翻译软件有哪些?如何高效提翻译?

你是否曾在面对满屏的英文Excel表格时感到头疼?项目报告、数据分析、财务报表... 当这些重要的信息被语言壁垒阻挡时,效率和理解度都会大打折扣。别担心,只需3分钟,我将带你轻松解锁excel翻译成中文的秘籍。 无论是职场新人还是老手,这一技巧都将是你的得力助手,让你在信息的海洋中畅游无阻。 方法一:使用同声传译王软件 同声传译王是一款专业的翻译软件,它支持多种语言翻译,可以excel

System.getProperties().

Java.version Java 运行时环境版本 java.vendor Java 运行时环境供应商 java.vendor.url Java 供应商的 URL java.home Java 安装目录 java.vm.specification.version Java 虚拟机规范版本 java.vm.specification.vendor