专题导读:大数据的系统结构

2024-01-16 15:50

本文主要是介绍专题导读:大数据的系统结构,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

专题导读

随着大数据处理从粗放走向集约,性能、成本、功耗等多方面的约束为面向数据的系统结构设计提供了新的维度。一方面,众核CPU、新型存储器件、开源硬件等的出现为面向大数据的系统结构提供了新的机 会;另一方面,新型应用对时延、吞吐等方面要求的不断提升对大数据的系统结构提出了新的挑战。本专题汇集了国内活跃在一线的系统结构研究者的5篇文章,从大数据处理的并发索引结构、分布式查询框架、大数据存储系统、大数据访存分析和开源硬件等多个角度,探讨面向大数据的 系统结构的新思路、新机遇与新挑战,希望能引起读者兴趣,推动相关领域的研究与实践。严赵峰与张为华撰写的《面向大数据 的索引结构研究进展》分析了数据存储体量的增加和应用对性能要求的提高给并发索引结构带来的挑战。从技术角度探讨了如何设计高效易用的并发控制策略与提升并发索引结构性能,并提出了利用新型硬件设计新的并发索引结构的方法。柯学翰与陈榕撰写的《基于图查询系统的图计算引擎》指出:尽管在实际应用中面向大数据的图查询与图计算系统是相互耦合的,但在当前研究中对两者的研究很多情况下是相互独立的,故而不能较好地发挥出数据与计算状态互联互通带来的效果。为此,该论文介绍了如何基于图查询系统设计一种图计算引擎,从而在单一系统中支持查询与计算操作,并通过一系列优化, 达到了较好的性能。陈游旻、李飞与舒继武撰写的《大数据环境下的存储系统构建:挑战、方法和趋势》指出:大数据不止更“大”,而且要更 “快”。论文分析了新型存储介质带来的机遇与挑战,从闪存存储与持久性存储两种存储系统的构建方案出发,阐述了其各自面临的挑战,并总结了现有方案以及未来发展趋势。李作骏等人撰写的《一种软硬件结合的 大数据访存踪迹收集分析工具集》指出了内存计算时代访存行为分析的重要性,并对当前访问行为分析工具存在的不足进行了阐述。基于这些分析,论文提出了一种软硬件 结合的大数据访存踪迹收集分析工具集, 通过硬件在线收集基本访存踪迹,并结合软件信息同步及离线标注的方式,为大数据提供高性能、高保真的访存分析与收集工具。王诲喆等人撰写的《开源芯片、RISC-V 与敏捷开发》指出:随着摩尔定律几乎失效,传统通用芯片开发策略难以持续,而当前芯片开发的高门槛限制了面向大数据等领域专用芯片的设计。论文介绍了开源芯片的发展历史及降低芯片开发门槛的作用,并对RISC-V指令集架构的特点进行了分析,分享了在前端设计中的敏捷开发实践,并对芯片开发的新发展与不足进行了讨论。本专题由于篇幅有限,不能涵盖面向大数据的系统结构的方方面面,希望通过阐述大数据系统结构面临的机遇与挑战,引起各界的关注和进一步研究,并推动其在多个行业中推广应用。

客座编辑

陈海波(1982- ),男,上海交通大学教授,博士生导师,主要研究方向为操作系统与并行分布式系统。获得2018年教育部技术发明奖一等奖,入选2014年国家“万人计划”青年拔尖人才计划,获得2011年全国优秀博士学位论文奖、2015年CCF青年科学家奖、2017年CCF NASAC-东软青年软件创新奖。目前担任ACM SIGOPS ChinaSys主席、ACMAPSys指导委员会主席、Communications of the ACM编委与Special Sections联合主席、ACMTransactions on Storage编委。曾任ACM SOSP 2017年大会主席、ACM CCS 2018系统安全领域主席、ACM SIGSAC奖励委员会委员。研究工作曾获得华为最高个人贡献奖、GoogleFaculty Research Award、IBM X10 Innovation Award、NetApp Faculty Fellowship等企业奖励。兼任SOSP 2019、CCS 2019、NDSS 2020、IEEE S&P 2020、ASPLOS 2020等会议的程序委员会委员。

包云岗(1980- ),男,博士,中国科学院计算技术研究所研究员,计算机体系结构国家重点实验室教授,先进计算机系统研究中心主任,中国科学院大学岗位教授。担任中国计算机学会理事、普及工作委员会主任,中国科学院青年创新促进会理事。主要研究方向为计算机系统结构,主持研制多款达到国际先进水平的系统,在国际会议期刊发表了40余篇论文,相关技术在华为技术有限公司、阿里巴巴集团、英特尔公司等国内外企业应用,多次受邀担任ASPLOS、ISCA、MICRO、SC等国际会议的程序委员会委员。

《大数据》期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的中文科技核心期刊。

640?wx_fmt=jpeg

关注《大数据》期刊微信公众号,获取更多内容

这篇关于专题导读:大数据的系统结构的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/613100

相关文章

Redis的数据过期策略和数据淘汰策略

《Redis的数据过期策略和数据淘汰策略》本文主要介绍了Redis的数据过期策略和数据淘汰策略,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录一、数据过期策略1、惰性删除2、定期删除二、数据淘汰策略1、数据淘汰策略概念2、8种数据淘汰策略

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

Python给Excel写入数据的四种方法小结

《Python给Excel写入数据的四种方法小结》本文主要介绍了Python给Excel写入数据的四种方法小结,包含openpyxl库、xlsxwriter库、pandas库和win32com库,具有... 目录1. 使用 openpyxl 库2. 使用 xlsxwriter 库3. 使用 pandas 库

SpringBoot定制JSON响应数据的实现

《SpringBoot定制JSON响应数据的实现》本文主要介绍了SpringBoot定制JSON响应数据的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录前言一、如何使用@jsonView这个注解?二、应用场景三、实战案例注解方式编程方式总结 前言

使用Python在Excel中创建和取消数据分组

《使用Python在Excel中创建和取消数据分组》Excel中的分组是一种通过添加层级结构将相邻行或列组织在一起的功能,当分组完成后,用户可以通过折叠或展开数据组来简化数据视图,这篇博客将介绍如何使... 目录引言使用工具python在Excel中创建行和列分组Python在Excel中创建嵌套分组Pyt

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

在Mysql环境下对数据进行增删改查的操作方法

《在Mysql环境下对数据进行增删改查的操作方法》本文介绍了在MySQL环境下对数据进行增删改查的基本操作,包括插入数据、修改数据、删除数据、数据查询(基本查询、连接查询、聚合函数查询、子查询)等,并... 目录一、插入数据:二、修改数据:三、删除数据:1、delete from 表名;2、truncate

Java实现Elasticsearch查询当前索引全部数据的完整代码

《Java实现Elasticsearch查询当前索引全部数据的完整代码》:本文主要介绍如何在Java中实现查询Elasticsearch索引中指定条件下的全部数据,通过设置滚动查询参数(scrol... 目录需求背景通常情况Java 实现查询 Elasticsearch 全部数据写在最后需求背景通常情况下

Java中注解与元数据示例详解

《Java中注解与元数据示例详解》Java注解和元数据是编程中重要的概念,用于描述程序元素的属性和用途,:本文主要介绍Java中注解与元数据的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参... 目录一、引言二、元数据的概念2.1 定义2.2 作用三、Java 注解的基础3.1 注解的定义3.2 内

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据