张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十)

本文主要是介绍张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

27a2befcbd00e48be7cec6cd356c5469.png

导读

 

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的3055名同学参加大数据能力提升项目,其中556位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据提升之路吧!

85bd64cb4d30fc7d085d8bfc3a836a26.png

张书源 化工系

2018 年,我进入了清华大学化学工程系系统工程课题组攻读博士学位。进入研究生阶段,我努力学习专业课程,了解研究领域的相关知识。我的研究方向是系统工程,具体主要包括对过程工程的建模、分析、优化、监控和控制等。在工业 4.0 和中国制造 2025 的背景下,制造业处在向数字化智能化转型升级的过程当中。在入学阶段,得知清华大数据研究中心设立了大数据能力提升项目之后,我便报了名,希望通过这一项目提升我的数据应用能力,并找到自己的研究方向。

在选择大数据能力提升项目课程时,我和自己的导师进行了交流。我的导师非常支持我的想法,并选择了大数据分析、算法、系统和实践作为我的课程。这些课程让我了解了大数据的特点、大数据的应用价值和算法。在课程实践项目中,我和小组的同学一起参与了北京艾漫数据科技股份有限公司的娱乐知识图谱构建的项目。我们爬取了部分网站上关于电影方面的语料并进行了清洗、标注,然后搭建并训练了基于 BiLSTM-CRF 的实体识别和关系抽取模型,最后用得到的实体和实体间的关系建立了知识图谱并进行可视化展示,取得了不错的效果。虽然这只是一个相对简单的样例,远没到工业应用的程度,但让我从爬取数据、数据清洗、模型训练和模型应用等方面,了解到了大数据从获取到产生价值的整个过程。

 21b7cbc9f71533e1c3abd41b9bf82d0d.png

在完成了项目的课程学习后,我开始思考将学到的方法应用在自己的研究领域上。过程监控是维持过程稳定运行、实现安全生产、提高产品合格率、提升工厂效益的重要一环。在分布式控制系统应用逐渐变广、工业数据获取越来越容易的现在,我开始思考怎样通过数据驱动的过程监控算法来代替传统的多元统计的方法和基于过程模型的方法。受到实践中学习到的循环神经网络启发,我尝试使用基于神经网络的过程故障诊断模型,这一模型利用滑动窗口处理数据,提升了故障诊断的正确率并提前了故障诊断的时间,有助于利用过程数据提升过程的平稳度。利用这一成果,我参加了 2019 年的全国过程工程年会并做了报告,取得了良好的反响。

23a62669c96419e135c532f3173452f4.png

除了对过程平稳运行的监控,我也尝试了神经网络算法构建产品质量预测的模型并利用这一模型寻找最佳的过程运行操作,实现制造过程的最大效益。乙烯裂解过程是石油化工的龙头,其产量标志着一个国家的石油化工水平。乙烯裂解的各种烯烃产品也是很多国民生活日用品的原料。乙烯裂解过程收到很多操作条件和原料组成的影响,常用的机理模型基于微分方程的求解,耗时较长,故过程操作优化难以实现。利用图神经网络模型和乙烯的裂解反应网络,我建立了数据驱动的乙烯裂解产品预测模型。这一模型能在很短时间内完成产品组成的预测,提高操作条件的优化速度,该成果已发表到 SCI 期刊上。

除了与工业结合,我探究了一些计算机视觉方法在先进制造中的应用。我与化工系微化工课题组合作,利用 MaskRCNN 和 ResNet 等计算机视觉方法实现了微流体中关键参数的自动推理,为微化工领域研究提供了一个省时省力的分析工具,加速微化工制造技术的开发和优化,提升了大约 1000 倍的分析效率。除了图片的自动分析,我也尝试了神经网络视频分析的技术,实现了微流体过程的动态特征分析,这在该领域以往的研究看来,是非常困难的。这一视频分析方法还有在线应用的可能。我的这些成果不仅发表了论文,还申请了专利并编写成了软件供相关研究人员使用。

e20da38ad91048fdf00151e8e4b478e5.png

很庆幸在我入学阶段就参与了项目的学习,这对于像我一样处在交叉学科领域的学生有很好的能力提升作用,不仅打下了良好的计算机技能基础,还可以通过实践了解到当前这些数据分析算法的最新进展。学习到的知识还可以启发自己的研究方向,在一些交叉学科的研究领域取得突破。这样的学科交叉、工业结合我认为是未来一段时间内很好的科学研究方向,也希望继续在此方向上继续努力,进行更加深入的研究。

编辑:文婧

校对:林亦霖

87034e5d1cb8e065067611fb78d7c5d8.png

这篇关于张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/900988

相关文章

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

MySQL中查找重复值的实现

《MySQL中查找重复值的实现》查找重复值是一项常见需求,比如在数据清理、数据分析、数据质量检查等场景下,我们常常需要找出表中某列或多列的重复值,具有一定的参考价值,感兴趣的可以了解一下... 目录技术背景实现步骤方法一:使用GROUP BY和HAVING子句方法二:仅返回重复值方法三:返回完整记录方法四:

IDEA中新建/切换Git分支的实现步骤

《IDEA中新建/切换Git分支的实现步骤》本文主要介绍了IDEA中新建/切换Git分支的实现步骤,通过菜单创建新分支并选择是否切换,创建后在Git详情或右键Checkout中切换分支,感兴趣的可以了... 前提:项目已被Git托管1、点击上方栏Git->NewBrancjsh...2、输入新的分支的

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

关于集合与数组转换实现方法

《关于集合与数组转换实现方法》:本文主要介绍关于集合与数组转换实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、Arrays.asList()1.1、方法作用1.2、内部实现1.3、修改元素的影响1.4、注意事项2、list.toArray()2.1、方

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

java实现docker镜像上传到harbor仓库的方式

《java实现docker镜像上传到harbor仓库的方式》:本文主要介绍java实现docker镜像上传到harbor仓库的方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 前 言2. 编写工具类2.1 引入依赖包2.2 使用当前服务器的docker环境推送镜像2.2

C++20管道运算符的实现示例

《C++20管道运算符的实现示例》本文简要介绍C++20管道运算符的使用与实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录标准库的管道运算符使用自己实现类似的管道运算符我们不打算介绍太多,因为它实际属于c++20最为重要的

Java easyExcel实现导入多sheet的Excel

《JavaeasyExcel实现导入多sheet的Excel》这篇文章主要为大家详细介绍了如何使用JavaeasyExcel实现导入多sheet的Excel,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录1.官网2.Excel样式3.代码1.官网easyExcel官网2.Excel样式3.代码

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查