清华团队夺冠清华-新南威尔士中澳数据科学大赛!跨学科交叉人才走出国门

本文主要是介绍清华团队夺冠清华-新南威尔士中澳数据科学大赛!跨学科交叉人才走出国门,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=png

【导语】2019年9月2日,一批清华大学大数据能力提升项目的学生,在清华大学清华-青岛数据科学研究院(以下简称:数据院)的资助下组队远赴澳洲新南威尔士大学(以下简称:UNSW)参加清华-新南威尔士中澳数据科学大赛。10人的参赛队伍包含了来自经管学院、航空学院、网络研究院等多个院系的学生,这样一支“背景复杂”的队伍,收获了第一、第二和第四的优异成绩。他们的成功秘诀在哪?他在比赛期间都有哪些收获呢?本文将为你揭晓。

640?wx_fmt=png
清华参赛队伍合影

“这次行程与其说去参赛,我更喜欢称之为‘游学’。”从澳洲回国后,一位参赛的同学发出这样的感想:“比赛期间大家的交流和互动非常多,有人技术实力强,能够很好的提供技术解决思路; 有人管理能力强,具有强大的策划与推动事情进展的能力;不同学科的同学互相组队反而能激发更多解决问题的思路。而我有幸和这样一群人朝夕相处一周,实在是我研究生第一年生涯里最棒的事情。 和这些来自清华的朋友,乃至UNSW的朋友结识,了解他们各自的人生经历和未来规划,实在是一件很棒的事情。这极大地开拓了我的眼界,看到了许多新的生活方式,解锁了新的观念和认识。”

2019第一届Data松暨清华-新南威尔士中澳数据科学大赛是由澳洲新南威尔士大学(UNSW)数学与统计学院和清华大学的数据科学研究院进行合作,在中澳大使馆及澳洲政府的大力支持下,举办的大型国际顶级赛事。本次比赛旨在促进双方学生之间的学术、文化交流;创造双方合作企业与学生之间的交流机会;同时,考验学生的业界问题解决能力、沟通能力及团队协作能力。数据院为促进大数据在跨学科领域的发展,对此次大赛给予了大力支持,鼓励不同学科背景的学生参与比赛,为他们提供全额资助,并由数据院的老师亲自带队保驾护航。

640?wx_fmt=png
全员备战

带队的齐老师回忆,学生们抵达UNSW的当天晚上就在互相讨论第二天的赛题,次日早上8点到达场地持续编程整整12个小时,有些同学投入到比赛的节奏中都忘记了吃饭。她见证了学生们对比赛的投入和认真:“第二天比赛结束后大家都很兴奋,晚上十点半回到宿舍继续准备次日的Presentation。虽然同学们都精疲力尽了,但是都感觉收获满满。”

“其实压力挺大的,UNSW的同学实力也很强,我们这支队伍各自的专业背景不同,大家的技术水平并不均衡。”一名参赛同学对我们说:“但我们也将这一问题转化成了我们的优势,我们第一时间将写代码、调程序、训练、测试、展示材料、实验报告等环节进行了明确分工,大家各自发挥所长,使得团队效率得到了最充分的利用。加上前期的精心准备,获得了让我们满意的成绩,在每个环节都保持了清华大学应有的水平,我们的能力互补组建了一个战斗力爆表的团队,能够在这样的团队里打比赛,我感到十分荣幸。“

在同学们12个小时的奋战后,清华的三支团队分别收获了第一、第二和第四的优异成绩。

640?wx_fmt=png

冠军团队获奖证书
在比赛之余,数据院的老师还为同学们组织了更多丰富精彩的交流活动,首先参观走访了UNSW,学生们表示收获满满:“参访UNSW时我们接触到了很多研究机器学习方向的同学,他们不仅知道模型的运用,也懂模型原理,还能对很多业界痛点和痒点侃侃而谈。自己要学的东西太多了,回到国内我也会继续钻研,不仅掌握好专业知识,也要了解业界需求,以问题为导向,更好的发挥数据科学的价值!

随后参观了optiver、servian和akuna三家科技及金融领域的澳洲本土企业,与当地的业界专家交流,也让同学们接触了不同学科不同领域的新知识。“了解算法本身固然重要,但更要去思考透过算法能够解决什么问题,利用前沿的技术解决现实应用场景才能创造更大的价值。问及此行最大的感触,一名同学这样总结道。

640?wx_fmt=png
走访合影

同时掌握大数据思维和应用创新能力的“π型”人才,正是数据院一直以来对培养大数据人才的核心定位。 此次澳洲之行不仅是一次技术练兵,也是开拓学生视野、培养学生应用创新能力的训练。 我们希望今后能从清华走出更多的高层次复合型人才,在全球大数据浪潮中,不断创新,不断突破,打造中国大数据最强集团军。



清华大学大数据能力提升项目简介:



中澳大赛简介:

清华大学数据科学院与澳洲新南威尔士大学(UNSW)数学与统计学院进行合作,举办2019年中澳大数据黑客松大赛,计划通过本地海选——统一决赛形式最终选拔6~8支中澳学生(总共)队伍参加最终在澳洲悉尼市举办的黑客松大赛决赛。本项目旨在扩大清华数据院与UNSW数学与统计学院在双方国家与城市的影响力,同时促进双方学生之间的学术、文化交流,也能够创造双方赞助公司与学生之间的交流机会,增进了解和感情。

本次举办的黑客松大赛(Hackathon)原意为编程马拉松,在该活动当中,电脑程序员以及其他与软件发展相关的人员,组成小队,以紧密合作的形式,在规定时间内根据题目完成题目所要求的预测、分类等功能,最终通过程序指标和现场展示由评委评出各类奖项。


了解更多信息,欢迎关注数据院官方微信公众号“数据派THU”,以及数据院官网:

(数据派THU)

(数据院官网)

这篇关于清华团队夺冠清华-新南威尔士中澳数据科学大赛!跨学科交叉人才走出国门的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901493

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

pandas数据过滤

Pandas 数据过滤方法 Pandas 提供了多种方法来过滤数据,可以根据不同的条件进行筛选。以下是一些常见的 Pandas 数据过滤方法,结合实例进行讲解,希望能帮你快速理解。 1. 基于条件筛选行 可以使用布尔索引来根据条件过滤行。 import pandas as pd# 创建示例数据data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dav