赵雪轩:数据科学助力我的智能化航天梦 | 提升之路系列

2024-04-13 21:18

本文主要是介绍赵雪轩:数据科学助力我的智能化航天梦 | 提升之路系列,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的2657名同学参加大数据能力提升项目,其中445位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

 

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据能力提升之路吧!

 

清华大学航天航空学院博士赵雪轩

研究方向:遥感卫星智能化

作为工科院系的学生,我在本科阶段是几乎没怎么上过大数据相关课程的,然而由于人工智能和大数据技术的兴起,导师希望我的博士课题能够将传统的遥感卫星课题与新兴的智能技术结合起来,系统性地讨论新技术在具有航天背景的课题上的应用,这也成为了我参加大数据能力提升项目的动因。

参加项目后我选择的第一门课程是大数据系统基础(A),在课程的大作业中,我选择了一个和工业紧密结合的风机油温预警的项目,并且担任了大作业团队的组长。在大作业的完成过程中一方面要对接真实的企业需求,另一方面也要与组员一起研究如何将企业的需求用数据科学的语言落地,可以说收获良多。同时我也从组员身上学到了很多东西,组员之一是一名美院的国际学生,他对于数据可视化的极致追求以及对于工业大数据的热忱让我相信工业大数据是大有可为的。

 

通过数据院提供的机会,我报名了中国高校 SAS 数据分析比赛。从没有接触过 SAS 软件的我,在数据科学院的老师、往届比赛获奖同学以及队友的帮助下,通过半个月的集中学习, 经过初赛与复赛的考验,最终作为清华大学队伍的一员取得了全国第五名的成绩, 并在钓鱼台领取了比赛的奖杯和奖状。这件事大大增强了我对于学好数据科学、大数据技术的信心。

另一门让我收获颇丰的课程是大数据分析与处理。在课程的大作业中,我们选择去参加 KDD Cup 2019 的比赛,比赛的题目是要求参与者使用从百度地图收集的历史用户行为数据和一组用户属性数据来推荐合适的交通方式。面对 KDD Cup 这样一个国际赛事,最开始我其实是信心不足的。大作业团队中我们四个人中只有一位同学是计算机专业,除我之外其他人分别是化学专业与生物医学专业,但是非常幸运的是同组的小伙伴们都是非常认真且有执行力的人。当时我们每周都会在上课时间之外集中进行讨论,分享各自在探索数据集以及数据分析处理过程中的新发现,还会在比赛的 QQ 群里向经常参加这类比赛的人取经。这些比赛“大佬”们很多都已经工作, 他们对于模型在解决真实问题时会遇到的问题有着丰富的经验,通过与他们的交流,我们发现一个好的项目的完成离不开对背后业务逻辑的深刻理解,同时也进一步认识到了今后若想将所学的大数据知识实践出来,需要建立在对技术本身和问题背景两方面的深刻理解上。通过扎实的数据分析与模型优化,最终我们小组“坚持党的领导”,取得了课程中所有参赛组中的最好成绩,在全球 1600 多只队伍中进入了前 5%。在疫情期间,我参加了华为的大数据挑战赛以作为培养计划中大数据实践课的替代,使用云上算力去进行模型的生成,对我自己来说也是很有收获的经历,这次参赛经历不仅让我在参赛的过程中学到了新知识,实际上更重要的是它还帮助我走出了疫情在家的低效工作困境。

参加大数据项目,让我对大数据与智能化相关技术有了一定的认识,最终找到了与遥感卫星课题结合的切入点。在项目方面,大数据课程中学习到的知识,也用在了和北汽、华为等企业开展的智能电动车的研究中。可以说大数据能力提升项目为我顺利完成博士课题的研究提供了重要的支撑,同时让我有可能去考虑在未来的工作中从事一些与大数据和人工智能相关的工作,看到更具可能性的未来。

最后衷心感谢为大数据能力提升项目付出辛苦的老师们,希望大数据能力提升项目越办越好,让更多的同学受益。

这篇关于赵雪轩:数据科学助力我的智能化航天梦 | 提升之路系列的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901242

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl