【JY】从4天到1.75小时,如何让Bladed仿真效率提升55倍?

2023-12-09 06:10

本文主要是介绍【JY】从4天到1.75小时,如何让Bladed仿真效率提升55倍?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

df6fc79dd334f2d2793096cfac751dd3.png

Bladed是一个用于风力发电机组性能和载荷仿真计算的建模工具,全球大型风力机制造商约有半数采用该软件

在风力发电机组的各个设计阶段,优化设计都是重中之重。如果不能正确地对载荷、恶劣环境和结构完整性进行建模,或不能执行准确试验,都可能会极大地危害机组长期的安全性、功能性和盈利能力。

风力机设计项目经常需要进行大量仿真计算,一组仿真计算耗费数千小时的计算机时。

一方面,算力在总量和项目波峰波谷期的弹性供应上能否满足需求。充足的算力意味着缩短产品上市时间,拉大市场优势。

另一方面,超大规模算力的调度使用和企业场景的复杂性带来的管理等问题对IT自动化和智能化要求很高。如何调度超大规模集群的过程,还有其中隐藏的成本优化问题,其实很多。

怎么解决这些问题?

我们拿实证说话。

实证背景信息

某风电新能源集团建设有本地机房,但机器较陈旧,资源有限。跑Bladed仿真任务计算周期长,特别是有大型仿真任务时,往往需要数周甚至数月才能出结果。

用户要求将跑大型任务的时间缩短到一天以内,同时能够对任务进行管理和监控。

实证目标 

1、Bladed任务能否在云端有效运行?

2、fastone平台能否将大规模Bladed仿真任务周期缩短到一天?

3、fastone平台能否提供高效灵活的数据传输方案?

4、fastone平台能否提供有效的任务管理和监控?

实证参数

平台:

fastone企业版产品

应用:

Bladed 4.10版

操作系统:
Bladed 4.10之前的版本不支持Linux系统,只支持Windows。

本次实证由于用户更熟悉Windows操作系统,所以并未选择Linux镜像。

主流云厂商对不同操作系统镜像有不同的定价方式。整体上来说,通过Windows系统使用云资源价格比Linux系统要贵。

0e43c4e786230b291c0d2f733d56c7cc.png

适用场景:

构建风力发电机性能模型,运行仿真计算并处理结果,为工程师提供有关风力机动力学和优化的重要决策信息。

License配置:

Bladed License Server设置在云端。

云端硬件配置:

Bladed是一个计算密集型应用,对CPU要求高、内存要求不大,因此平台为用户推荐选择了满足其应用特点的计算优化型实例机型。

调度器:

因为选择了Windows操作系统,所以本实证中集群调度使用的是PBS调度器。

技术架构图:

用户通过Web方式登录构建于公有云上的fastone算力运营平台,根据实际计算需求自动创建、销毁集群,提交计算任务,上传下载任务,监控管理。

用户通过NAT方式访问位于公网的License服务器。

用户通过VPN接入,可更安全地访问云上私密的HPC环境。

12a90a686d72d9a496f1981cbe987122.png

实证场景一:大规模业务验证

9600个用例

本地VS云端300核

结论:

1、云端可提供满足Bladed应用特点的机型,运行Bladed Windows版本的任务;

2、本地资源运算9600个用例,耗时约4天;通过fastone平台调用300核计算优化型实例运算9600个用例,总耗时约8小时,任务运行时间7小时;

3、fastone平台的自动化伸缩,有效降低整个计算周期资源占用率;

4、fastone平台能提供灵活高效的数据传输方案,满足计算数据量大需求;

5、fastone平台可稳定运行Bladed任务、测试过程中未发生服务中断;

6、fastone平台可监控、管理任务与集群的运行情况。

f895ed250884f5c12b5047184da8ba25.png

实证过程:

1、数据上传:用户将Bladed风文件、工况文件等上传至fastone平台;

2、数据处理:自动下载、解压数据,修改配置;

3、自动可扩展集群启动:用户选择Bladed 应用,按需构建300个核的Bladed集群;

4、任务运:提交任务后,用户可随时在监控界面查看任务和集群运行情况;

5、结果数据上传:任务运行成功后,自动将结果数据上传至对象存储供用户下载。

c8b8b945011e05a3241535ce56ea3628.png

数据传输优化:

Bladed的风文件和任务文件数据量极大,传统传输模式往往会面临以下问题:

1、初始化大文件传输。在本实证中,用户在跑任务之前需要上传多达数百GiB的风文件;

2、随着任务的调整,有大量小文件需要增量上传。在本实证中,用户需要上传9600个任务文件,每个几十MiB不等。

fastone支持全自动化数据上传,可充分利用带宽,帮助用户快速上传、下载海量数据

同时,利用fastone自主研发的分段上传、高并发、断点续传等数据传输技术,优化海量数据的传输效率。

自动化部署:

在手动模式下,通常都是先构建一个固定规模的集群,然后提交任务,全部任务结束后,关闭集群。

在本实证中,如果是手动部署,300核的集群一旦拉起,第一到第五步手动配置的时间里,所有机器一直都是开启状态,也就是说,烧钱中。

更详尽的涉云成本计算,可参考:帮助CXO解惑上云成本的迷思,看这篇就够了

再看看我们的自动化部署:

在本实证中,fastone平台在任务的不同阶段采取不同的策略应对,除任务运行的7小时内有300核云资源满负荷运作以外,在数据处理和结果数据上传阶段均只开启了1-2台机器,而其他准备过程不需要开启机器。

很重要的一点是:任务完成后会及时下载结果并自动关机。

8edb8a255e4c4e3d2639039144f67419.png

fastone的Auto-Scale功能可以自动监控用户提交的任务数量和资源的需求,动态按需地开启所需算力资源,在提升效率的同时有效降低成本。

用户可根据自己需求,设置自动化调度集群规模上下限。

  • 所有操作都是自动化完成,无需用户干预;

  • 在实际开机过程中,可能遇到云在某个可用区资源不足的情况,fastone会自动尝试从别的区域开启资源;

  • 如果需要的资源确实不够,又急需算力完成任务,用户还可以从fastone界面选择配置接近的实例类型来补充。

0ccab91f7615be42e668835f420b9773.png

详细分解手动模式 VS 自动部署,看这里:EDA云实证Vol.1:从30天到17小时,如何让HSPICE仿真效率提升42倍?

任务和集群管理:

提交任务后,可以在监控界面中查看任务和集群运行情况。

d63128a627b6bfc57e8500b1bcb18c80.png

实证场景二:云端线性扩展验证

9600个用例

云端300核 VS 3000核

Bladed应用具备线性扩展性。

当我们把自动化调度集群规模上限设为3000核,任务运行时间从7小时缩短到45分钟,整体计算周期也从8小时缩短至1.75小时。

06181bf8de0c29a3d1f42ae37ed45316.png

实证过程:

276ba04fc6e7bd70bea6ee9e937c2655.png

本实证中,单个任务运行时间为10-30分钟,当有任务提前运行完成且数据下载完后,相应的机器会自动关闭,避免资源浪费。

实证小结

最后我们回顾一下实证目标:

1、Bladed Windows版本任务在云端能够有效运行;

2、fastone平台成功将大规模Bladed仿真任务的运算时间从4天缩短到1~7小时;

3、fastone平台能够提供灵活高效的数据传输方案;

4、fastone平台能够提供可靠的任务管理和监控。

除了Windows系统,我们还支持通过fastone平台同时调度任务至本地和云上的Windows节点和Linux节点,满足业务需求。同时,我们也支持SLURM/SGE/LSF等主流调度器,本次实证未曾涉及。

本次CAE行业Cloud HPC实证系列Vol.2就到这里了。

在下一期的实证中,我们将利用速石平台,在混合云场景下调度集群运行CAE分析,使LS-DYNA模拟性能得到极大提升。

未来我们还会带给大家更多领域的用云“真香”实证,请保持关注哦!

 END -

我们有个CAE云仿真平台

集成多种CAE/CFD应用,大量任务多节点并行

应对短时间爆发性需求,连网即用

跑任务快,原来几个月甚至几年,现在只需几小时

5分钟快速上手,拖拉点选可视化界面,无需代码

支持高级用户直接在云端创建集群 

扫码免费试用,送300元体验金,入股不亏~

36cc2688949b6bb2554e10f14e061504.png

更多电子书

欢迎扫码关注小F(ID:imfastone)获取

5e5e1e218d3fecfb975df8fe5d02e3cc.png

你也许想了解具体的落地场景:

这样跑COMSOL,是不是就可以发Nature了

Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?

1分钟告诉你用MOE模拟200000个分子要花多少钱

LS-DYNA求解效率深度测评 │ 六种规模,本地VS云端5种不同硬件配置

揭秘20000个VCS任务背后的“搬桌子”系列故事

155个GPU!多云场景下的Amber自由能计算

怎么把需要45天的突发性Fluent仿真计算缩短到4天之内?

国内最大规模OPC上云,5000核并行,效率提升53倍

提速2920倍!用AutoDock Vina对接2800万个分子

从4天到1.75小时,如何让Bladed仿真效率提升55倍?

从30天到17小时,如何让HSPICE仿真效率提升42倍?

关于为应用定义的云平台

这一届科研计算人赶DDL红宝书:学生篇

杨洋组织的“太空营救”中, 那2小时到底发生了什么?

速石科技获元禾璞华领投数千万美元B轮融资

一次搞懂速石科技三大产品:FCC、FCC-E、FCP

速石科技成三星Foundry国内首家SAFE™云合作伙伴

Ansys最新CAE调研报告找到阻碍仿真效率提升的“元凶”

国内超算发展近40年,终于遇到了一个像样的对手

帮助CXO解惑上云成本的迷思,看这篇就够了

花费4小时5500美元,速石科技跻身全球超算TOP500

039b80b500df4e559440cc1d46082740.png

这篇关于【JY】从4天到1.75小时,如何让Bladed仿真效率提升55倍?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/472747

相关文章

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

基于UE5和ROS2的激光雷达+深度RGBD相机小车的仿真指南(五):Blender锥桶建模

前言 本系列教程旨在使用UE5配置一个具备激光雷达+深度摄像机的仿真小车,并使用通过跨平台的方式进行ROS2和UE5仿真的通讯,达到小车自主导航的目的。本教程默认有ROS2导航及其gazebo仿真相关方面基础,Nav2相关的学习教程可以参考本人的其他博客Nav2代价地图实现和原理–Nav2源码解读之CostMap2D(上)-CSDN博客往期教程: 第一期:基于UE5和ROS2的激光雷达+深度RG

java学习,进阶,提升

http://how2j.cn/k/hutool/hutool-brief/1930.html?p=73689

JAVA用最简单的方法来构建一个高可用的服务端,提升系统可用性

一、什么是提升系统的高可用性 JAVA服务端,顾名思义就是23体验网为用户提供服务的。停工时间,就是不能向用户提供服务的时间。高可用,就是系统具有高度可用性,尽量减少停工时间。如何用最简单的方法来搭建一个高效率可用的服务端JAVA呢? 停工的原因一般有: 服务器故障。例如服务器宕机,服务器网络出现问题,机房或者机架出现问题等;访问量急剧上升,导致服务器压力过大导致访问量急剧上升的原因;时间和

perl的学习记录——仿真regression

1 记录的背景 之前只知道有这个强大语言的存在,但一直侥幸自己应该不会用到它,所以一直没有开始学习。然而人生这么长,怎就确定自己不会用到呢? 这次要搭建一个可以自动跑完所有case并且打印每个case的pass信息到指定的文件中。从而减轻手动跑仿真,手动查看log信息的重复无效低质量的操作。下面简单记录下自己的思路并贴出自己的代码,方便自己以后使用和修正。 2 思路整理 作为一个IC d

文章解读与仿真程序复现思路——电力自动化设备EI\CSCD\北大核心《考虑燃料电池和电解槽虚拟惯量支撑的电力系统优化调度方法》

本专栏栏目提供文章与程序复现思路,具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源程序擅长文章解读,论文与完整源程序,等方面的知识,电网论文源程序关注python

提升PrestaShop外贸电商网站安全的几款行业必备工具

提升PrestaShop外贸电商网站安全的几款行业必备工具 PrestaShop发展历程 PrestaShop是一款优秀且强大的外贸开源电商软件,我们开始使用PrestaShop始于2009年,那时PrestaShop还是0.9版本:界面清新,性能强悍,扩展友好等特性,既没有Magento的笨重,也没有ZenCart的古老,更没有OpenCart的脆弱,因此PrestaShop如雨后春笋,迅速

stl的sort和手写快排的运行效率哪个比较高?

STL的sort必然要比你自己写的快排要快,因为你自己手写一个这么复杂的sort,那就太闲了。STL的sort是尽量让复杂度维持在O(N log N)的,因此就有了各种的Hybrid sort algorithm。 题主你提到的先quicksort到一定深度之后就转为heapsort,这种是introsort。 每种STL实现使用的算法各有不同,GNU Standard C++ Lib

Hbase Filter+Scan 查询效率优化

Hbase Filter+Scan 查询效率问题 众所周知,Hbase利用filter过滤器查询时候会进行全表扫描,查询效率低下,如果没有二级索引,在项目中很多情况需要利用filter,下面针对这种情况尝试了几种优化的方案,仅供参考,欢迎交流。 根据业务要求,作者需要根据时间范围搜索所需要的数据,所以作者设计的rowKey是以时间戳为起始字符串的。 正确尝试: 1.scan 设置 开始行和结

如何提高开发的效率,让老板不知所措的给你发工资

设计模式 UML JSP 编程 数据结构 1.你可能会常常发现,写了一段代码后,编译程序时是一大堆的出错 (原因:语法不熟)  ──别担心,这是每个程序员必须经历的事,这时候你就需要更大的耐心及细心,对每一行代码进行仔细人阅读并改正,这个很重要,这可以培养你的理解代码能力,所以要常读程序,不要等到程序运行以后才知道你的程序的结果。  ──如何避免:在写代码以前,要认真的学习计算机语