张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十)

本文主要是介绍张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

27a2befcbd00e48be7cec6cd356c5469.png

导读

 

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的3055名同学参加大数据能力提升项目,其中556位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据提升之路吧!

85bd64cb4d30fc7d085d8bfc3a836a26.png

张书源 化工系

2018 年,我进入了清华大学化学工程系系统工程课题组攻读博士学位。进入研究生阶段,我努力学习专业课程,了解研究领域的相关知识。我的研究方向是系统工程,具体主要包括对过程工程的建模、分析、优化、监控和控制等。在工业 4.0 和中国制造 2025 的背景下,制造业处在向数字化智能化转型升级的过程当中。在入学阶段,得知清华大数据研究中心设立了大数据能力提升项目之后,我便报了名,希望通过这一项目提升我的数据应用能力,并找到自己的研究方向。

在选择大数据能力提升项目课程时,我和自己的导师进行了交流。我的导师非常支持我的想法,并选择了大数据分析、算法、系统和实践作为我的课程。这些课程让我了解了大数据的特点、大数据的应用价值和算法。在课程实践项目中,我和小组的同学一起参与了北京艾漫数据科技股份有限公司的娱乐知识图谱构建的项目。我们爬取了部分网站上关于电影方面的语料并进行了清洗、标注,然后搭建并训练了基于 BiLSTM-CRF 的实体识别和关系抽取模型,最后用得到的实体和实体间的关系建立了知识图谱并进行可视化展示,取得了不错的效果。虽然这只是一个相对简单的样例,远没到工业应用的程度,但让我从爬取数据、数据清洗、模型训练和模型应用等方面,了解到了大数据从获取到产生价值的整个过程。

 21b7cbc9f71533e1c3abd41b9bf82d0d.png

在完成了项目的课程学习后,我开始思考将学到的方法应用在自己的研究领域上。过程监控是维持过程稳定运行、实现安全生产、提高产品合格率、提升工厂效益的重要一环。在分布式控制系统应用逐渐变广、工业数据获取越来越容易的现在,我开始思考怎样通过数据驱动的过程监控算法来代替传统的多元统计的方法和基于过程模型的方法。受到实践中学习到的循环神经网络启发,我尝试使用基于神经网络的过程故障诊断模型,这一模型利用滑动窗口处理数据,提升了故障诊断的正确率并提前了故障诊断的时间,有助于利用过程数据提升过程的平稳度。利用这一成果,我参加了 2019 年的全国过程工程年会并做了报告,取得了良好的反响。

23a62669c96419e135c532f3173452f4.png

除了对过程平稳运行的监控,我也尝试了神经网络算法构建产品质量预测的模型并利用这一模型寻找最佳的过程运行操作,实现制造过程的最大效益。乙烯裂解过程是石油化工的龙头,其产量标志着一个国家的石油化工水平。乙烯裂解的各种烯烃产品也是很多国民生活日用品的原料。乙烯裂解过程收到很多操作条件和原料组成的影响,常用的机理模型基于微分方程的求解,耗时较长,故过程操作优化难以实现。利用图神经网络模型和乙烯的裂解反应网络,我建立了数据驱动的乙烯裂解产品预测模型。这一模型能在很短时间内完成产品组成的预测,提高操作条件的优化速度,该成果已发表到 SCI 期刊上。

除了与工业结合,我探究了一些计算机视觉方法在先进制造中的应用。我与化工系微化工课题组合作,利用 MaskRCNN 和 ResNet 等计算机视觉方法实现了微流体中关键参数的自动推理,为微化工领域研究提供了一个省时省力的分析工具,加速微化工制造技术的开发和优化,提升了大约 1000 倍的分析效率。除了图片的自动分析,我也尝试了神经网络视频分析的技术,实现了微流体过程的动态特征分析,这在该领域以往的研究看来,是非常困难的。这一视频分析方法还有在线应用的可能。我的这些成果不仅发表了论文,还申请了专利并编写成了软件供相关研究人员使用。

e20da38ad91048fdf00151e8e4b478e5.png

很庆幸在我入学阶段就参与了项目的学习,这对于像我一样处在交叉学科领域的学生有很好的能力提升作用,不仅打下了良好的计算机技能基础,还可以通过实践了解到当前这些数据分析算法的最新进展。学习到的知识还可以启发自己的研究方向,在一些交叉学科的研究领域取得突破。这样的学科交叉、工业结合我认为是未来一段时间内很好的科学研究方向,也希望继续在此方向上继续努力,进行更加深入的研究。

编辑:文婧

校对:林亦霖

87034e5d1cb8e065067611fb78d7c5d8.png

这篇关于张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/900988

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象