Angel 3.2.0新版本出炉!图计算能力再次加强

2024-03-23 18:38

本文主要是介绍Angel 3.2.0新版本出炉!图计算能力再次加强,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Angel项目的3.2.0版本发布啦!

Angel是腾讯首个AI开源项目,经过多个版本迭代,于2019年在Linux基金会顺利毕业。作为面向机器学习的第三代高性能计算平台,Angel提供了全栈的机器学习能力,并致力于解决高维稀疏大模型训练以及大规模分布式图计算的问题

图片

在3.1.0的版本中,Angel首次引入了图计算能力,提供了大量开箱即用的图算法,得到了业界广泛的关注和使用。本次版本发布,Angel继续加强了图计算的能力,相较于上个版本,我们做了很多优化并提供了一些新的特性,感兴趣的话就赶紧下载体验吧,期待你的反馈哦。

主要新特性如下:

图计算分层抽象与灵活扩展

Angel3.1.0版本提供了大量开箱即用的图算法,但在使用过程中,部分用户反馈需要根据自己的业务场景做定制化的二次开发以及新算法的研发。因此我们对图计算框架做了系统性的三层抽象:图计算引擎层、图操作算子层以及图算法层,并在图操作算子层提供了常用的十几种算子抽象如init、get、walker、sample等以及自定义算子接口。基于上述抽象,用户可以快速、灵活地在算法层扩展或实现自定义图算法。

参数服务器与MPI混合运行模式

图算法种类繁多,主要可分为三大类:传统图挖掘算法、图表示学习算法和图神经网络算法,每一种算法都有着不同的计算流程,对计算平台的要求也不一样,这导致图计算解决方案非常的碎片化,很难在一个平台中支持所有类型的算法。Angel是一个基于参数服务器模式的计算平台,在过去的版本中,我们对参数服务器做了大量的优化和功能上的增强:例如算法流程上的优化、自定义PS函数和计算下推等,使得Angel能够同时支撑这三大类算法,并且大部分算法都有着良好的性能,但仍然有少部分算法计算不够高效,这主要受限于参数服务器模式的一些局限性:例如数据交互不够直接、重复存储浪费内存空间、大规模任务连接数爆炸,稠密模型聚合效率不是最优等。鉴于以上原因,我们在3.2.0版本中开始探索下一代图计算框架,尝试将参数服务器模式和MPI模式优势结合起来,具体做法是将Angel PS以嵌入式的方式启动在Worker(或Executor)中,并优化网络通信拓扑,节点之间可以根据算法特征采用最高效的通信方式,在一个模型中可以同时使用PS模式和MPI常见的环状通信拓扑等。这个功能特性目前还处在expermental阶段,3.2.0版本将会首先在游走类算法上做一些尝试。

自适应的模型分区方式

模型的分区路由一般有range和hash两种方式,它们有各自的优缺点,比如range分区方式占用内存少,计算快但是容易造成计算上的负载不均衡且往往需要节点id是数值类型且编码在连续的空间才会比较高效,需要在图训练之前就提前做一些预处理的操作。而hash分区方式能够解决负载不均衡问题,且能支持任意类型的节点id,不需要对图做编码预处理的工作,该分区方式图算法的增量训练也很容易支持,但是其内存占用较多。我们对参数服务器模型分区路由方式做了优化,能够同时支持range和hash的分区,在实际的图算法训练过程中可以根据不同的算法计算特性自适应地选择合适的模型分区方式,有效解决图训练预处理、存储和计算上的负载不均衡以及增量训练等问题。

支持复杂异构Graph Embedding

现实很多业务场景中图网络往往是复杂异构的,一些常见的同构GNN算法很难学到有效的表达,因此需要更加复杂的异构Graph Embedding来解决问题。而图计算平台支持复杂异构GNN算法往往面临着多重挑战:比如复杂异构网络存储问题,网络中可能存在多种不同类型的节点,每个节点又可能有多种属性,每个节点对还可能有多种类型的边以及边有多种属性; 又比如复杂异构网络的计算问题,由于存在多种不同类型的节点、边以及属性,需要提供多种能够支撑复杂操作的算子及其组合进行计算。我们丰富和拓展了图的存储结构和计算模式,针对复杂操作提供灵活的自定义ps func接口,能够良好的支持复杂异构图网络的存储和计算,并且能够支持高维稀疏的图节点特征,可以很容易地进行异构图的表征学习。同时我们也新增了HAN、异构GAT、异构GraphSage、IGMC边预测以及异构Bipartite GraphSage等5个开箱即用的异构图神经网络算法。

千亿边大图的高性能优化

大规模图算法在容错和计算性能上相对的要求也更高,我们针对千亿边大图训练做了专门的性能优化并在现网的共享集群做了性能测试,在K-core和common friends两个算法的测试结果为在内存消耗降低30%的同时,计算性能还有3倍的提升。

图片

机器学习算法库丰富

新增十几种特征工程方法以及1个多任务学习算法esmm

想了解更多细节,请参考官方release notes:

https://github.com/Angel-ML/angel/releases/tag/Release-3.2.0

 

这篇关于Angel 3.2.0新版本出炉!图计算能力再次加强的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/839186

相关文章

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

PostgreSQL中的多版本并发控制(MVCC)深入解析

引言 PostgreSQL作为一款强大的开源关系数据库管理系统,以其高性能、高可靠性和丰富的功能特性而广受欢迎。在并发控制方面,PostgreSQL采用了多版本并发控制(MVCC)机制,该机制为数据库提供了高效的数据访问和更新能力,同时保证了数据的一致性和隔离性。本文将深入解析PostgreSQL中的MVCC功能,探讨其工作原理、使用场景,并通过具体SQL示例来展示其在实际应用中的表现。 一、

InnoDB的多版本一致性读的实现

InnoDB是支持MVCC多版本一致性读的,因此和其他实现了MVCC的系统如Oracle,PostgreSQL一样,读不会阻塞写,写也不会阻塞读。虽然同样是MVCC,各家的实现是不太一样的。Oracle通过在block头部的事务列表,和记录中的锁标志位,加上回滚段,个人认为实现上是最优雅的方式。 而PostgreSQL则更是将多个版本的数据都放在表中,而没有单独的回滚段,导致的一个结果是回滚非

JeecgBoot 升级springboot版本到2.6.0

1. 环境描述 Jeecgboot 3.0,他所依赖的springboot版本为2.3.5Release,将springboot版本升级为2.6.0。过程全纪录,从2开始描述。 2. 修改springboot版本号 <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-pare

Cmake之3.0版本重要特性及用法实例(十三)

简介: CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布:《Android系统多媒体进阶实战》🚀 优质专栏: Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏: 多媒体系统工程师系列【原创干货持续更新中……】🚀 优质视频课程:AAOS车载系统+AOSP14系统攻城狮入门视频实战课 🚀 人生格言: 人生从来没有捷径,只有行动才是治疗恐惧

Windows 10 各版本

对应于服务选项的 Windows 10 当前版本 Version服务选项上市日期OS build最后修订日期1803半年频道7/10/201817134.1917/24/2018Microsoft 建议使用1803半年频道(定向)4/30/201817134.1917/24/20181709半年频道1/18/201816299.5797/24/20181709半年频道(定向)10/17/2017

hector_quadrotor编译总结 | ubuntu 16.04 ros-kinetic版本

hector_quadrotor编译总结 | ubuntu 16.04 ros-kinetic版本 基于Ubuntu 16.04 LTS系统所用ROS版本为 Kinetic hector_quadrotor ROS包主要用于四旋翼无人机的建模、控制和仿真。 1.安装依赖库 所需系统及依赖库 Ubuntu 16.04|ros-kinetic|Gazebo|gazebo_ros_pkgs|ge

hector_quadrotor编译总结 | ubuntu 14.04 ros-indigo版本

hector_quadrotor编译总结 | ubuntu 14.04 ros-indigo版本 基于Ubuntu 14.04 LTS系统所用ROS版本为 Indigo hector_quadrotor ROS包主要用于四旋翼无人机的建模、控制和仿真。 备注:两种安装方式可选:install the binary packages | install the source files

微信小程序uniappvue3版本-控制tabbar某一个的显示与隐藏

1. 首先在pages.json中配置tabbar信息 2. 在代码根目录下添加 tabBar 代码文件 直接把微信小程序文档里面的四个文件复制到自己项目中就可以了   3. 根据自己的需求更改index.js文件 首先我这里需要判断什么时候隐藏某一个元素,需要引入接口 然后在切换tabbar时,改变tabbar当前点击的元素 import getList from '../

Zookeeper集群是如何升级到新版本的

方案1:复用老数据方案 这是经过实践的升级方案,该方案是复用旧版本的数据,zk集群拓扑,配置文件都不变,只是启动的程序为最新的版本。 参考文章: Zookeeper集群是如何升级到新版本的 方案2:重新建立数据方案 该方案的思路是:先停掉一台follower的机器上的服务,然后加入一个新版本的zk(zk的数据目录是空的),然后启动新zk,之后新zk会把旧集群中的数据同步过来。之后再操作另