本文主要是介绍Apache Kudu 1.4.0 中文文档,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
ApacheCN cwiki 地址为 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813594
已完成 80%,欢迎加入我们一起来完成翻译!~
还差一点点就完工了,欢迎有想法的朋友,一起来维护迭代更新,另找找一位 kudu 的 admin,专门跟进这个事情,需要花的时间,稍微多一点点,有兴趣的联系我!!!
Apache Kudu 1.4.0 中文文档
- 介绍 Kudu
- Kudu 入门指南
- 安装指南
- 配置 Kudu
- Kudu 集成 Apache Impala
- 管理 Kudu
- Kudu 故障排除
- 使用 Kudu 开发应用程序
- Kudu Schema Design ( 模式设计 )
- Kudu Security ( 安全 )
- Kudu Transaction Semantics ( 事务语义 )
- 后台维护任务
- Kudu 配置参考
- Kudu 命令行工具参考
- 已知的问题和限制
- 贡献于 Kudu
- Export Control Notice ( 出口管制通知 )
Kudu 是一个针对 Apache Hadoop 平台而开发的列式存储管理器。Kudu 共享 Hadoop 生态系统应用的常见技术特性: 它在 commodity hardware(商品硬件)上运行,horizontally scalable(水平可扩展),并支持 highly available(高可用)性操作。
Kudu 有许多不错的设计,它的一些优点包括 :
- OLAP 工作的快速处理。
- 与 MapReduce,Spark 和其他 Hadoop 生态系统组件集成。
- 与 Apache Impala(incubating)紧密集成,使其与 Apache Parquet 一起使用 HDFS 成为一个很好的可变的替代方案。
- 强大而灵活的一致性模型,允许您根据每个 per-request(请求选择)一致性要求,包括 strict-serializable(严格可序列化)一致性的选项。
- 针对同时运行顺序和随机工作负载的情况性能很好。
- 易于管理以及可以使用 Cloudera Manager 来进行管理。
- High availability(高可用性)。Tablet Servers 和 Masters 使用了 Raft Consensus Algorithm,确保只要有一半以上的副本可用,该 tablet 便可用于读写。例如,如果 3 个副本中有 2 个或 5 个副本中的 3 个可用,则该 tablet 可用。即使在 leader tablet 出现故障的情况下,读取功能也可以通过 read-only(只读的)follower tablets 来进行服务。
- 结构化数据模型。
通过结合这些所有的特性,Kudu 目标是支持在当代 Hadoop 存储技术上难以实现的应用的家族。Kudu 是一个很好的解决方案的几个例子是 :
- 报告那些需要立即向终端用户提供 newly-arrived(新来的)数据的应用程序。
- 必须同时支持的 Time-series(时间序列)应用程序 :
- 查询大量历史数据。
- 必须非常快地返回关于单个实体的细粒度查询。
- 使用预测模型进行实时决策的应用程序,可根据所有历史数据定期刷新预测模型。
- 有关这些和其他方案的更多信息,请参阅 Example Use Cases。
。。。。。。
更多细节介绍请看 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813605
这篇关于Apache Kudu 1.4.0 中文文档的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!