本文主要是介绍自研P2P镜像分发系统,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Overview
镜像P2P主要用于解决大规模容器分发场景下的镜像拉取性能问题,目前主流的开源解决方案有Dragonfly(Alibaba)以及Kraken(Uber),
这两种解决方案各有优缺点,设计模式也各有不同:
- Dragonfly:采用supernode中心控制设计模式,所有的peer数据传输任务都由supernode负责调度,整个集群将管理集中在supernode组件
- Kraken:采用随机分散设计模式,Tracker组件只负责管理所有peer的连接信息(包括各个peer拥有的数据),而实际的数据传输流程则交由各个peer自行协商决定
Eagle充分参考了Dragonfly,Kraken以及FID的原理和特性。
在上述项目基础上去掉了一些不必要特性,保留了最核心的组件和功能,精简而实用
特性支持
目前Eagle
支持如下特性:
- Non-invasive:
Eagle
对docker以及docker distribution代码无侵入,可以无感知对接 - High-availability:
Eagle
从客户端侧以及服务端侧实现了Tracker
以及Seeder
的高可用,整个架构无单点故障 - SSI(Seeder Storage Interface):
Eagle
对Seeder
存储实现了插件式接口,用户可以根据SSI接口实现对接第三方存储(目前默认本地文件系统) - Host level speed limit:
Eagle
提供针对整个节点P2P下载和上传的网络限速功能 - LRUCache delete policy:
Eagle
提供LRU算法实现Proxy测和Seeder测的磁盘回收功能,并提供参数限制Cache使用大小 - Lightweight:
Eagle
由少数核心组件构成,理论上是P2P系统组件的最小集合,属于轻量级的解决方案
未来Eagle
希望支持如下特性:
- Peer optimal arithmetic:
Eagle
希望实现基于网络拓扑的Peer优选算法,提高传输效率以及节省跨IDC带宽 - Push notification mechanism:实现镜像上传同步更新到
Seeder
Cache,这样可以最大限度减少Seeder
回源操作
其中,Peer optimal arithmetic
是目前所有开源项目都没有实现的特性(参考Kraken #244和Dragonfly #1311),也是本项目的重点研究对象
原理
Eagle由如下组件组成:
- Proxy:部署在各个节点上,充当docker的代理,对docker拉取镜像的请求进行过滤以及将请求转发给P2P网络(EagleClient)
- EagleClient:P2P网络中的Peer端,负责执行P2P下载以及上传具体任务
- Seeder:种子服务器,负责生成镜像分层的种子文件,并充当P2P网络镜像分层数据文件的第一个上传Peer
- Tracker:保存了P2P网络拓扑中每个Peer的地址信息,同时记录了每个Peer的数据下载情况
- Origin:镜像仓库,可以是任何镜像仓库(docker distribution, harbor, quay等)的入口地址
整个架构图如下:
Workflow
当docker执行拉取镜像操作时,其请求会被Proxy劫持。Proxy会对请求进行过滤,如果是对镜像分层的拉取请求,则会转交给EagleClient执行;否则直接代理请求
EagleClient在接受到Proxy转发过来的请求后,首先判断本地磁盘是否存在对应的文件,如果存在则直接返回;否则进入P2P下载流程
整个P2P下载流程大致如下:
EagleClient首先会从Seeder获取镜像分层的种子文件。Seeder在接受到请求后,检查本地是否存在对应文件,如果不存在,则会回源拉取,然后根据数据文件生成种子文件,返回给EagleClient;并向Tracker宣布自己作为该镜像分层的uploader。EagleClient获取到种子文件后,会向Tracker获取P2P网络中该数据文件对应分片的Peer地址和下载信息,然后依据BT协议进行P2P下载
请求流程图如下:
实现
Eagle的代码短小而精炼,接下来我们从代码层面探讨一下上述特性的具体实现
GRPC
EagleClient使用GRPC协议从Seeder获取种子文件,以提高传输效率
协议文件metainfo.proto
内容如下:
syntax = "proto3";package metainfo;// The metainfo service definition.
service MetaInfo {// Get metainforpc GetMetaInfo (MetaInfoRequest) returns (MetaInfoReply) {}
}// The request message containing the source request
message MetaInfoRequest {string url = 1;
}// The response message containing the metainfo bytes
message MetaInfoReply {bytes metainfo = 1;
}
EagleClient newMetaInfoClient
:
func (e *BtEngine) newMetaInfoClient() (pb.MetaInfoClient, error) {rsv, err := endpoint.NewResolverGroup("eagleclient")if err != nil {return nil, err}rsv.SetEndpoints(e.seeders)name := fmt.Sprintf("eagleclient-%s", picker.RoundrobinBalanced.String())balancer.RegisterBuilder(balancer.Config{Policy: picker.RoundrobinBalanced,Name: name,Logger: zap.
这篇关于自研P2P镜像分发系统的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!