专题导读:大数据的系统结构

2024-01-16 15:50

本文主要是介绍专题导读:大数据的系统结构,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

专题导读

随着大数据处理从粗放走向集约,性能、成本、功耗等多方面的约束为面向数据的系统结构设计提供了新的维度。一方面,众核CPU、新型存储器件、开源硬件等的出现为面向大数据的系统结构提供了新的机 会;另一方面,新型应用对时延、吞吐等方面要求的不断提升对大数据的系统结构提出了新的挑战。本专题汇集了国内活跃在一线的系统结构研究者的5篇文章,从大数据处理的并发索引结构、分布式查询框架、大数据存储系统、大数据访存分析和开源硬件等多个角度,探讨面向大数据的 系统结构的新思路、新机遇与新挑战,希望能引起读者兴趣,推动相关领域的研究与实践。严赵峰与张为华撰写的《面向大数据 的索引结构研究进展》分析了数据存储体量的增加和应用对性能要求的提高给并发索引结构带来的挑战。从技术角度探讨了如何设计高效易用的并发控制策略与提升并发索引结构性能,并提出了利用新型硬件设计新的并发索引结构的方法。柯学翰与陈榕撰写的《基于图查询系统的图计算引擎》指出:尽管在实际应用中面向大数据的图查询与图计算系统是相互耦合的,但在当前研究中对两者的研究很多情况下是相互独立的,故而不能较好地发挥出数据与计算状态互联互通带来的效果。为此,该论文介绍了如何基于图查询系统设计一种图计算引擎,从而在单一系统中支持查询与计算操作,并通过一系列优化, 达到了较好的性能。陈游旻、李飞与舒继武撰写的《大数据环境下的存储系统构建:挑战、方法和趋势》指出:大数据不止更“大”,而且要更 “快”。论文分析了新型存储介质带来的机遇与挑战,从闪存存储与持久性存储两种存储系统的构建方案出发,阐述了其各自面临的挑战,并总结了现有方案以及未来发展趋势。李作骏等人撰写的《一种软硬件结合的 大数据访存踪迹收集分析工具集》指出了内存计算时代访存行为分析的重要性,并对当前访问行为分析工具存在的不足进行了阐述。基于这些分析,论文提出了一种软硬件 结合的大数据访存踪迹收集分析工具集, 通过硬件在线收集基本访存踪迹,并结合软件信息同步及离线标注的方式,为大数据提供高性能、高保真的访存分析与收集工具。王诲喆等人撰写的《开源芯片、RISC-V 与敏捷开发》指出:随着摩尔定律几乎失效,传统通用芯片开发策略难以持续,而当前芯片开发的高门槛限制了面向大数据等领域专用芯片的设计。论文介绍了开源芯片的发展历史及降低芯片开发门槛的作用,并对RISC-V指令集架构的特点进行了分析,分享了在前端设计中的敏捷开发实践,并对芯片开发的新发展与不足进行了讨论。本专题由于篇幅有限,不能涵盖面向大数据的系统结构的方方面面,希望通过阐述大数据系统结构面临的机遇与挑战,引起各界的关注和进一步研究,并推动其在多个行业中推广应用。

客座编辑

陈海波(1982- ),男,上海交通大学教授,博士生导师,主要研究方向为操作系统与并行分布式系统。获得2018年教育部技术发明奖一等奖,入选2014年国家“万人计划”青年拔尖人才计划,获得2011年全国优秀博士学位论文奖、2015年CCF青年科学家奖、2017年CCF NASAC-东软青年软件创新奖。目前担任ACM SIGOPS ChinaSys主席、ACMAPSys指导委员会主席、Communications of the ACM编委与Special Sections联合主席、ACMTransactions on Storage编委。曾任ACM SOSP 2017年大会主席、ACM CCS 2018系统安全领域主席、ACM SIGSAC奖励委员会委员。研究工作曾获得华为最高个人贡献奖、GoogleFaculty Research Award、IBM X10 Innovation Award、NetApp Faculty Fellowship等企业奖励。兼任SOSP 2019、CCS 2019、NDSS 2020、IEEE S&P 2020、ASPLOS 2020等会议的程序委员会委员。

包云岗(1980- ),男,博士,中国科学院计算技术研究所研究员,计算机体系结构国家重点实验室教授,先进计算机系统研究中心主任,中国科学院大学岗位教授。担任中国计算机学会理事、普及工作委员会主任,中国科学院青年创新促进会理事。主要研究方向为计算机系统结构,主持研制多款达到国际先进水平的系统,在国际会议期刊发表了40余篇论文,相关技术在华为技术有限公司、阿里巴巴集团、英特尔公司等国内外企业应用,多次受邀担任ASPLOS、ISCA、MICRO、SC等国际会议的程序委员会委员。

《大数据》期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的中文科技核心期刊。

640?wx_fmt=jpeg

关注《大数据》期刊微信公众号,获取更多内容

这篇关于专题导读:大数据的系统结构的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/613100

相关文章

【服务器运维】MySQL数据存储至数据盘

查看磁盘及分区 [root@MySQL tmp]# fdisk -lDisk /dev/sda: 21.5 GB, 21474836480 bytes255 heads, 63 sectors/track, 2610 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesSector size (logical/physical)

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

数据时代的数字企业

1.写在前面 讨论数据治理在数字企业中的影响和必要性,并介绍数据治理的核心内容和实践方法。作者强调了数据质量、数据安全、数据隐私和数据合规等方面是数据治理的核心内容,并介绍了具体的实践措施和案例分析。企业需要重视这些方面以实现数字化转型和业务增长。 数字化转型行业小伙伴可以加入我的星球,初衷成为各位数字化转型参考库,星球内容每周更新 个人工作经验资料全部放在这里,包含数据治理、数据要

如何在Java中处理JSON数据?

如何在Java中处理JSON数据? 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们将探讨在Java中如何处理JSON数据。JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,在现代应用程序中被广泛使用。Java通过多种库和API提供了处理JSON的能力,我们将深入了解其用法和最佳

两个基因相关性CPTAC蛋白组数据

目录 蛋白数据下载 ①蛋白数据下载 1,TCGA-选择泛癌数据  2,TCGA-TCPA 3,CPTAC(非TCGA) ②蛋白相关性分析 1,数据整理 2,蛋白相关性分析 PCAS在线分析 蛋白数据下载 CPTAC蛋白组学数据库介绍及数据下载分析 – 王进的个人网站 (jingege.wang) ①蛋白数据下载 可以下载泛癌蛋白数据:UCSC Xena (xena

中国341城市生态系统服务价值数据集(2000-2020年)

生态系统服务反映了人类直接或者间接从自然生态系统中获得的各种惠益,对支撑和维持人类生存和福祉起着重要基础作用。目前针对全国城市尺度的生态系统服务价值的长期评估还相对较少。我们在Xie等(2017)的静态生态系统服务当量因子表基础上,选取净初级生产力,降水量,生物迁移阻力,土壤侵蚀度和道路密度五个变量,对生态系统供给服务、调节服务、支持服务和文化服务共4大类和11小类的当量因子进行了时空调整,计算了

【计算机网络篇】数据链路层(12)交换机式以太网___以太网交换机

文章目录 🍔交换式以太网🛸以太网交换机 🍔交换式以太网 仅使用交换机(不使用集线器)的以太网就是交换式以太网 🛸以太网交换机 以太网交换机本质上就是一个多接口的网桥: 交换机的每个接口考研连接计算机,也可以理解集线器或另一个交换机 当交换机的接口与计算机或交换机连接时,可以工作在全双工方式,并能在自身内部同时连通多对接口,使每一对相互通信的计算机都能像

使用Jsoup抓取数据

问题 最近公司的市场部分布了一个问题,到一个网站截取一下医院的数据。刚好我也被安排做。后来,我发现为何不用脚本去抓取呢? 抓取的数据如下: Jsoup的使用实战代码 结构 Created with Raphaël 2.1.0 开始 创建线程池 jsoup读取网页 解析Element 写入sqlite 结束

Excel实用技巧——二级下拉菜单、数据验证

EXCEL系列文章目录   Excel系列文章是本人亲身经历职场之后萌发的想法,为什么Excel覆盖如此之广,几乎每个公司、学校、家庭都在使用,但是它深藏的宝藏功能却很少被人使用,PQ、BI这些功能同样适用于数据分析;并且在一些需要简单及时的数据分析项目前,Excel是完胜python、R、SPSS这些科学专业的软件的。因此决心开启Excel篇章。 数据分析为什么要学Excel Excel图表

OSG学习:LOD、数据分页、动态调度

LOD(level of detail):是指根据物体模型的结点在显示环境中所处的位置和重要度,决定物体渲染的资源分配,降低非重要物体的面数和细节度,从而获得高效率的渲染运算。在OSG的场景结点组织结构中,专门提供了场景结点osg::LOD来表达不同的细节层次模型。其中,osg::LOD结点作为父节点,每个子节点作为一个细节层次,设置不同的视域,在不同的视域下显示相应的子节点。 数据分页:在城市