分布式计算平台Hadoop 发展现状

2024-02-25 12:30

本文主要是介绍分布式计算平台Hadoop 发展现状,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

解读:分布式计算平台Hadoop 发展现状

2012年05月04日01:23 IT168
字号: T| T

  【IT168 技术】雅虎开发者Doug Cutting六年前创建了一个用于管理,存储和分析大量数据的分布式计算平台hadoop,现在大家也称云计算平台,用他儿子的玩具大象命名,并把它交给阿帕奇软件基金会。鉴于围绕Hadoop建立的整个行业的迅速,这会使某些人觉得非常惊讶,那就是阿帕奇软件基金会最近才推出了Apache Hadoop 1.0被认为是足够稳定而成为“企业就绪”的第一个版本。

  Hadoop乱象

  雅虎开发者Doug Cutting六年前创建了一个用于管理,存储和分析大量数据的平台,用他儿子的玩具大象命名,并把它交给阿帕奇软件基金会。鉴于围绕Hadoop建立的 整个行业的迅速发展,这会使某些人觉得非常惊讶,那就是阿帕奇软件基金会最近才推出了Apache Hadoop 1.0被认为是足够稳定而成为“企业就绪”的第一个版本。

  但这并没有延缓创业和建立供应商加入Hadoop的队伍。随着大数据这一热点,解决方案提供商需要跟上行业中的关键角色。以下就是围绕Hadoop的11个创新业务。

解读:分布式计算平台Hadoop 发展现状

   1. Cloudera

  Cloudera,成立于2008年,也许是最成立的年轻的致力于 Hadoop的公司。 帕洛阿尔托,加州公司提供了一个Apache Hadoop软件的商业发行版叫做Cloudera Enterprise,它包括支持,咨询服务,培训和一个称为Cloudera Management Suite的软件。

  一个例子说明了Cloudera的技术如何寻求广泛使用,Oracle在一月表示它已经将Cloudera的Hadoop发行版和Cloudera Manager整合到Oracle Big Data Appliance中。

  Cloudera在2009年聘请Doug Cutting担任“架构师”时有了炫耀的资本。Cutting是原阿帕奇软件基金会Hadoop项目的创始人并且是现任董事。

  2. Datameer

  业务产生和存储的数据量每三年翻一番。加之数据是结构化和非结构化信息的混合体这一事实,往往分散在不同的IT系统,对于有商业智能项目的任何公司都是一个严重的挑战。

  Datameer分析解决方案始于Datameer(2009年于加州圣马刁成立),用一个电子表格界面与Apache Hadoop结合,帮助企业用户对非常大的数据集进行分析多种来源的结构化和非结构化数据无需编程。

  虽然分析大型数据一直是一个大的公司难题,但Datameer作出令人信服的观点:中小企业现在面临着类似的挑战,成本低的商品存储使收集大量的数据在经济上可行的。

  3. Hadapt

  Hadapt称其Hadapt自适应分析平台结合了Hadoop和关系数据库管理软件的优点成为一个单独的数据平台。其成果就是一个高性能分析系统,对结构化和非结构化数据都能很好处理。

  公 司成立于2010年七月,在十月的第一轮融资公司募集950万美元并在十一月推出了Hadapt 1.0,为潜在客户试用。依照公司称,该软件对Hadoop和其蜂巢数据仓储技术做了“巨大的性能改进”。软件有云和企业版,不久还有一个免费的社区版。 它们可运行在所有主流的Hadoop发行版上,包括Amazon EMR, Apache, Cloudera, EMC, Hortonworks, IBM和MapR。

  4. Hortonworks

  2011年七月推出的Hortonworks是雅虎Hadoop工程团队的一个分拆,提供其自有的 Hadoop版本称为Hortonworks数据平台。相对年轻的公司,阿帕奇项目的贡献者,这都被广泛视为Cloudera的主要竞争对手。一月公司推 出Hortonworks数据平台第二版,通过下一代MapReduce架构提供更好的性能和可用性,用Hadoop分布式文件系统(HDFS)提高可扩 展性,并且由HDFS名字节点的高可用性提高了数据完整性。

  对了,加利福尼亚州,桑尼维尔,公司的名字来自于苏斯博士的书《霍顿与无名氏》,为了符合Hadoop大象主题。

  5. HStreaming

  虽然Hadoop事实上也许是处理大量数据的引擎,但它主要用于批处理。实时分析数据把Hadoop的价值提升到一个全新的水平。这就是HStreaming的由来。

  成立于2010年,位于芝加哥的HStreaming是一个建立在Hadoop上的可扩展的,可持续的数据分析系统。它可以分析,可视化并处理大量连续数据比如一个金融交易系统实时。

  6. Hyve Solutions

  虽然大多数Hadoop相关的公司都是独立创业,但Hyve Solutions是联强IT经销商的一个部门。成立于去年,Hyve Solutions提供了成套的配置,称为Big D Series 8,公司表示它能让开发基于Hadoop的大数据分析系统在数天完成而不是数月。

  Hyve Solutions平台包含了Zettaset的基于Hadoop的容错系统,Arista Networks的云网络设备,Solarflare Communications的网络接口硬件和软件,还有Fusion-io的闪存数据存储技术。

  7. Karmasphere

  位于加州库比提诺的Karmasphere称自己为“大数据智能”引领者,其软件工具可从Hadoop提取和分析数据。

  Karmasphere Analyst为信息分析员提供对Hadoop中结构化和非结构化数据的访问,使他们能够进行点对点查询,对结果可视化并可操作。Karmasphere Studio提供了用于开发运行于Hadoop自定义算法的工具。Karmasphere Analytics Engine(分析引擎)是公司软件的基础。

  Karmasphere,2010年三月推出,已经于几乎Hadoop的所有供应商和组织合作 过,包括阿帕奇软件基金会,IBM,Cloudera,亚马逊云计算服务(AWS)和Hortonworks。公司在二月推出Karmasphere Analyst 1.8,带有新的并行查询功能。

  8. MapR Technologies

  MapR Technologies提供了一个Apache Hadoop的发行版,将之与Cloudera和HortonWorks还有其他公司竞争。公司成立于2009年年六月,有一些关键优势,包括与EMC有 战略联盟,并且在八月的第二轮融资募集2000万美元资金。

  MapR位于加州圣若泽,十二月的MapR Hadoop发行版1.2有新的虚拟机功能,高性能的本地访问库,Mac和Windows客户端,和利用MapReduce 2.0技术的能力。

  9. Mortar Data

  Mortar Data宣称自己是“Hadoop,没有复杂性”。总部设在纽约,该公司为那些“没有充分利用数据”的客户提供基于云的Hadoop服务,并表示它可以请客户来且运行不到一小时。

  Mortar Data,成立于2010年,为客户的大数据项目建立私有的,按需求的Hadoop集群,并使用Pig和Python建立“为执行优化过的工作”。亚马逊 的S3云存储用于数据读写。客户只在运行他们任务时支付,没有与之相关的基础设施和雇佣和培训工程师的费用。

  10. Tidemark Systems

  Tidemark Systems,位于加州红木城,开发其称为第一个企业级性能管理平台和为云计算建立的应用。因为Tidemark EPM应用系统是建立在Cloudera的Hadoop发行版基础上,大数据随之而来,它可以从海量复杂数据中进行提取。

  公司成立于2010年,Tidemark主要面向制造业,消费电子产品,零售业和高科技公司上的应用。一月公司从风险投资家和仁科创始人戴夫杜菲尔德获得240万美元的第三轮融资。

  11. Zettaset

  最早与2009年以GOTO Metrics的名字推出,Zettaset已经开发出建立在Hadoop和其他用于聚集和大量数据分析的开源技术上的一个容错系统。依照公司所称,该技术有助于掌控整个企业Hadoop系统的健康度,安全性和管理。

  Zettaset位于加州山景城,在十二月推出其第四版,带有新的服务管理特性和一个独特的可视化用户界面。公司在七月(获得三百万美元融资后)根据zettabyte更名等于一百万petabyte或一亿terabyte的数据。

这篇关于分布式计算平台Hadoop 发展现状的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/745470

相关文章

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

hadoop开启回收站配置

开启回收站功能,可以将删除的文件在不超时的情况下,恢复原数据,起到防止误删除、备份等作用。 开启回收站功能参数说明 (1)默认值fs.trash.interval = 0,0表示禁用回收站;其他值表示设置文件的存活时间。 (2)默认值fs.trash.checkpoint.interval = 0,检查回收站的间隔时间。如果该值为0,则该值设置和fs.trash.interval的参数值相等。

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

如何解决线上平台抽佣高 线下门店客流少的痛点!

目前,许多传统零售店铺正遭遇客源下降的难题。尽管广告推广能带来一定的客流,但其费用昂贵。鉴于此,众多零售商纷纷选择加入像美团、饿了么和抖音这样的大型在线平台,但这些平台的高佣金率导致了利润的大幅缩水。在这样的市场环境下,商家之间的合作网络逐渐成为一种有效的解决方案,通过资源和客户基础的共享,实现共同的利益增长。 以最近在上海兴起的一个跨行业合作平台为例,该平台融合了环保消费积分系统,在短

Android平台播放RTSP流的几种方案探究(VLC VS ExoPlayer VS SmartPlayer)

技术背景 好多开发者需要遴选Android平台RTSP直播播放器的时候,不知道如何选的好,本文针对常用的方案,做个大概的说明: 1. 使用VLC for Android VLC Media Player(VLC多媒体播放器),最初命名为VideoLAN客户端,是VideoLAN品牌产品,是VideoLAN计划的多媒体播放器。它支持众多音频与视频解码器及文件格式,并支持DVD影音光盘,VCD影

【区块链 + 人才服务】区块链集成开发平台 | FISCO BCOS应用案例

随着区块链技术的快速发展,越来越多的企业开始将其应用于实际业务中。然而,区块链技术的专业性使得其集成开发成为一项挑战。针对此,广东中创智慧科技有限公司基于国产开源联盟链 FISCO BCOS 推出了区块链集成开发平台。该平台基于区块链技术,提供一套全面的区块链开发工具和开发环境,支持开发者快速开发和部署区块链应用。此外,该平台还可以提供一套全面的区块链开发教程和文档,帮助开发者快速上手区块链开发。