​李明轩:提升大数据素养,辅助电力系统实时决策研究 | 提升之路系列(八)...

本文主要是介绍​李明轩:提升大数据素养,辅助电力系统实时决策研究 | 提升之路系列(八)...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

16f37f6b4e844795f9068042996ed082.png

导读

 

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的3055名同学参加大数据能力提升项目,其中556位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据提升之路吧!

618c24b7b70c266571451a735035e038.png

李明轩 电机系

我是电机系二年级博士生李明轩,从本科期间便对人工智能技术感兴趣,自学了很多人工智能相关知识,而研究生阶段的大数据项目对我的知识储备、编程技能、行业认知等方面都带来了极为显著的提升,也为了今后的科研及人生选择打开了一扇新的大门。

课程知识方面,除去实践课以外,我选修了大数据分析(B)、数据可视化、深度学习等三门课程,这几门课程相辅相成,为我的人工智能知识和编程技能带来了质的飞越。大数据分析(B)是我上的第一门项目课,该课程内容广泛,涵盖了统计学知识、机器学习及深度学习算法、人工智能技术的前沿进展和落地等多方面内容。其中崔鹏老师讲述的推荐系统、图与网络等知识更是引人入胜,让我了解到深度学习算法在如今的社会中具有着巨大的价值,包括但不限于电商、搜索引擎、智慧城市、智慧医疗等领域,使我了解了许多大数据技术的前沿内容。此外,该课程的大作业是参与一次具有一定含金量的竞赛,这次竞赛显著地提高了我的 debug 能力和对人工智能算法的实际认知。我有幸与软院的同学组队,并从他们的讨论中收获良多,这使得我不再仅仅是一名调包侠。在与他们的探讨中,我意识到要仔细探索数据的分布,构造合适的数据集以保证模型的性能。最终,我所使用的采样方法也显著提高了预测效果,使得我们的排名成功杀入前 20,可以说是一次颇有价值的经历。

2502b05c3bdbeacbb34091dd13be2fe5.png

大数据竞赛成果

我选修的第二门课是数据可视化,该课程直接让我从 0 到 1 了解了前端的内容。该课程手把手地交我们使用 D3.js 可视化库,并且在实践的过程中令我充分学习了javascript,css,html 的知识,并在大作业中掌握了 bootstrap,jquery 等库,为我后面实践课的前端开发打下了基础。

08986cd642a0c1f48019a40f09426840.png

数据可视化课程展示

我选修的第三门课是龙明盛老师的深度学习。难能可贵的是,龙老师用许多生动形象的方法详细讲解了各个深度学习方法的基本原理,这个方法为什么要设计成这个样子,其背后蕴含着怎样的数学原理,这些对我的深度学习的认知以及今后的科研都带来了显著的收获。

而大数据项目中最为我带来收获的是大数据实践课。得益于项目导师的悉心指导,我们从零开始有效地掌握了以下内容:Hadoop、Spark 等大数据平台的基本原理及使用,网络异常行为分析方法,基于 Javascript 的前端开发及基于 Flask 的后端开发,系统架构设计及产品研发、优化思路等,让我们学到了如何从 0 到 1 打磨出一款产品。令我印象深刻的就是其中的系统架构设计与产品优化部分,这些对我以后的思维和工作必然会产生重要影响。此外,我也有幸结识了许多优秀的同伴,他们从产品界面的设计、机器学习算法的思考、项目分工与合作等多方面给我带来了巨大的启发。而经由大家的共同努力,我们小组最终当选了优秀小组。

eac031098dc3084760282906192f46d2.png

大数据实践课成果展示

b37e5912f631d3b7605afa6a10433f65.png

实践课优秀团队奖

此外,在与项目导师的交流中也产生了一些对择业的思考。本次项目我们是在赋乐科技完成的,这是一家初创企业。我们曾好奇为何项目导师选择了这样一家尚未上市的企业,他说在创业公司能够更好地把握行业前沿, 承担更重要的工作,产生更开阔的视野。这些话都给我们带来了一定的启发。

除去课内学习和实践以外,大数据项目也给我的科研带来了一定的帮助。我的本科毕业设计即为深度学习算法在电力系统中的应用。而在博士一年级期间,借由导师的耐心指导和大数据课程知识的帮助,我成功地完成了第一篇学术论文。该论文将深度学习方法与混合整数规划相结合,有效地提高了电力系统中机组组合问题的在线决策效率。该文目前已发表于 IEEE Transactions on Sustainable Energy 期刊。此外,我目前也基于深度学习方法完成了一些负荷缺失值填充、负荷预测等工作。我的博士课题也考虑围绕人工智能方法在电力系统优化决策问题中的应用而展开。而在今后的科研工作中,我也会经常翻出来大数据项目的课程资料, 巩固自己的相关知识。

整体而言,大数据项目对我的知识储备、编程技能、学术研究、行业认知、就业方向等各方面都带来了显著的帮助。非常感谢大数据项目能为我带来如此显著的收获,也希望大数据项目能够越办越好。

编辑:于腾凯

校对:林亦霖

7a0900998dbec32ad1ae086f01734075.png

这篇关于​李明轩:提升大数据素养,辅助电力系统实时决策研究 | 提升之路系列(八)...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/900986

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

电力系统中的A类在线监测装置—APView400

随着电力系统的日益复杂和人们对电能质量要求的提高,电能质量在线监测装置在电力系统中得到广泛应用。目前,市场上的在线监测装置主要分为A类和B类两种类型,A类和B类在线监测装置主要区别在于应用场景、技术参数、通讯协议和扩展性。选择时应根据实际需求和应用场景综合考虑,并定期维护和校准。电能质量在线监测装置是用于实时监测电力系统中的电能质量参数的设备。 APView400电能质量A类在线监测装置以其多核

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount