导师男团来袭 | 开源之夏2022,与Alluxio一起探索数据编排的奇妙世界

本文主要是介绍导师男团来袭 | 开源之夏2022,与Alluxio一起探索数据编排的奇妙世界,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

活动简介

开源之夏(英文简称 OSPP)是由“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,今年是第三届,由中国科学院软件研究所与 openEuler 社区共同举办,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展,培养和发掘更多优秀的开发者。

 

 活动联合国内外各大开源社区,针对重要开源软件的开发与维护提供项目任务,并面向全球高校学生开放报名

学生可在本活动中自主选择感兴趣的项目任务进行申请,并在中选后获得该开源项目资深维护者(社区导师)亲自指导的机会,完成项目并贡献给社区后,参与学生还将获得开源之夏活动奖金和结项证书


 社区介绍

Alluxio系统是全球首个分布式超大规模数据编排系统,孵化于加州大学伯克利分校AMP实验室。自项目开源以来,已有超过来自300多个组织机构的1200多位贡献者参与开发,包括全球最头部科技公司、最顶尖的计算机科研院所等,现已成为发展最快的开源大数据项目之一。目前,全球十大互联网公司中已有包括Facebook、Airbnb、Uber、阿里巴巴、腾讯和字节跳动在内的八家企业部署了Alluxio,还有更多大型企业在生产中运行 Alluxio。

社区GitHub:https://github.com/Alluxio

Slack:https://alluxio-community.slack.com/

网站:https://www.alluxio.io/

除了了解Alluxio系统背景之外,Alluxio为本次“开源之夏”配备的导师男团也不容错过:

下面有请 Alluxio导师男团(自带BGM)

 如需入群与以上导师沟通,请添加Alluxio小助手(VX:Alluxio_Tianyu),请备注“开源之夏”


项目介绍

【项目一】:优化和完善Alluxio数据编排开源项目的单元测试功能

【项目导师】:刘嘉承(jiacheng@alluxio.com),Alluxio 核心开发工程师,硕士毕业于哥伦比亚大学,目前就职于Alluxio公司研发团队核心组。发布了Alluxio K8s Helm Chart。参与并主导了一些Alluxio的RPC和内核优化工作。

 

【难度】:基础

【项目描述】:众所周知,一套设计良好的单元测试保证了开源项目的质量和可维护性。本项目重点在于加强Alluxio应用客户端的测试覆盖率和关键功能的正确性保障。我们希望通过本项目的任务,使得Alluxio开源项目的单元测试(unit test)质量得到进一步补充、完善和加强,通过单元测试保障已有功能,为未来的优化和拓展铺平道路。

【产出要求】:

  1. 针对Alluxio数据编排开源项目的单元测试功能进行优化和完善
  2. 至少包含三个以上优化和完善点

【技术要求】:

熟悉Java编程,分布式系统以及单元测试

更多项目信息:https://summer-ospp.ac.cn/#/org/prodetail/226ea0337

【项目】二:Alluxio数据编排系统的分布式缓存管理机制优化

【项目导师】:范斌(binfan@alluxio.com),Alluxio公司创始成员&开源社区副总裁。本科毕业于中科大计算机系,随后取得卡内基梅隆大学计算机博士学位。博士期间在分布式系统算法和系统实现等方向发表多篇包括SIGCOMM, SOSP, NSDI等顶级国际会议论文以及多篇专利。加入Alluxio前, 范斌在Google从事下一代大规模分布式存储系统的研究与开发,曾获得谷歌年度技术奖。

 【项目描述】:分布式缓存是Alluxio数据编排开源项目的重要特性之一。而如何有效利用和管理各个worker上的缓存空间则成为了影响分布式缓存性能的关键因素。我们在本项目中希望针对现有的缓存清空机制进行功能上的拓展,分两个维度:(1)在现有默认的异步清空操作的基础上,增加支持“同步”清空操作的功能可选项;(2)在现有默认针对所有worker统一执行清空操作的基础上,增加“可指定”若干特定worker实施清空操作。

【难度】:进阶

【产出要求】:

针对Alluxio数据编排系统现有的缓存清空机制从两个维度进行功能上的拓展:

  1. 增加支持“同步”清空操作的功能;
  2. 增加“可指定”若干特定worker实施清空操作。

【技术要求】:

熟悉Java编程,分布式缓存

更多项目信息:https://summer-ospp.ac.cn/#/org/prodetail/226ea0340

针对以上2个学生项目,我们除了配备专门导师,还会有男团其他成员全程助力,同时社区的其他专家也会给予项目辅导与支持。


参与方式

学生自由选择项目,与社区导师沟通实现方案并撰写项目计划书。被选中的学生将在社区导师指导下,按计划完成开发工作,并将成果贡献给社区。社区评估学生的完成度,主办方根据评估结果发放活动奖金给学生


活动日程

课题项目将于 5 月 21 日开始正式接受学生申请,当前正处于「学生与社区项目沟通期」,欢迎大家进群咨询相关事宜,与项目导师线上交流沟通。


与导师沟通

目前Alluxio的2个项目已经成功发布,正式进入学生与导师沟通阶段,各位学生如果对上述项目感兴趣,欢迎你加入Alluxio开源社区的开源之夏项目交流群,与对应导师及社区专家进行沟通交流。

【群聊加入方式】:

方式一:扫描下方二维码(如二维码失效,请采用第二种方式)

方式二:请添加Alluxio小助手(VX:Alluxio_Tianyu),请备注“开源之夏”

这篇关于导师男团来袭 | 开源之夏2022,与Alluxio一起探索数据编排的奇妙世界的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/493858

相关文章

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解

Oracle存储过程里操作BLOB的字节数据的办法

《Oracle存储过程里操作BLOB的字节数据的办法》该篇文章介绍了如何在Oracle存储过程中操作BLOB的字节数据,作者研究了如何获取BLOB的字节长度、如何使用DBMS_LOB包进行BLOB操作... 目录一、缘由二、办法2.1 基本操作2.2 DBMS_LOB包2.3 字节级操作与RAW数据类型2.

MySQL使用binlog2sql工具实现在线恢复数据功能

《MySQL使用binlog2sql工具实现在线恢复数据功能》binlog2sql是大众点评开源的一款用于解析MySQLbinlog的工具,根据不同选项,可以得到原始SQL、回滚SQL等,下面我们就来... 目录背景目标步骤准备工作恢复数据结果验证结论背景生产数据库执行 SQL 脚本,一般会经过正规的审批