本文主要是介绍Borg:Google集群管理大杀器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
论文研读
系列是阅读、总结计算机领域优秀论文的系列文章。由于论文的学术性较高,无法面面俱到,只会就关键思想进行概括介绍。
简介
Google的Borg集群系统需要管理数十万个jobs,要能够提高资源使用率、隔离性,通过调度策略降低关联故障发生率,通过声明式job描述语言简化复杂性。
Borg提供三个主要优势:
1.隐藏资源管理与故障处理的细节,用户可以集中在应用开发上2.高可用、高稳定3.O(10000)机器规模内高效任务调度
相关术语
1.job and task,一个job包含多个task,每个task包含多个进程
2.nameing and monitoring,通过borg name service
提供服务发现。每个task都要提供健康检查HTTP接口,用于查询task的健康信息和各种指标数据3.cluster and cells,cell表示一组机器,cell中的机器构成一个集群
这篇关于Borg:Google集群管理大杀器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!