龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台

本文主要是介绍龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文/尚旭春

Intel Sapphire Rapids(简称SPR)即第四代至强可扩展处理器,是 Intel 承上启下的一代产品。新引入增强指令、硬件加速器、 AMX 矩阵计算、SGX 机密计算、Scalable IOV、PCIe 5.0、CXL1.1 协议,涵盖了计算、安全、I/O 及虚拟化方面的众多技术升级和增强。 

龙蜥社区对 Intel 平台的支持一直领先于业界,紧随 Intel 研发节奏,基于 Intel Arch SIG 第一时间完成对 SPR 产品全面的支持,助力龙蜥用户以开箱即用的方式,享用新技术特性,整体支持情况如下图:

以上特性均在龙蜥社区得到全面支持:

加速器层面,Anolis 5.10 内核已经支持 DSA、IAA,配合龙蜥社区提供的 accel-config 用户态工具,用户可以对这两个加速器进行快速配置并使能。对于 QAT 和 DLB ,其驱动已经以 OOT 的形式发布于龙蜥社区,用户只需下载安装对应的 rpm 包即可享用新硬件加速带来的性能提升。

安全层面,龙蜥社区已经集成 SGX 的 SDK/PSW/DCAP 软件栈,并以 rpm 包形式发布,用户可以通过 Anolis 系统便捷部署自己的机密计算方案。

虚拟化层面,Anolis 内核率先支持 SIOV 特性,用户不论是使用 SPR 平台自带的硬件加速器,还是支持 SIOV 的第三方硬件,抑或是 DWQ/SWQ 的部署形式,都可以无感使用,真正做到了 One for All 。 

以下以对 AMX 指令的支持为例,介绍一下基于 Anolis 内核构建业务方案所带来的巨大性能提升:

Anolis 通过支持 AMX 指令并对其进行深层次的优化,搭建如图所示基于 Anolis 内核的深度学习方案,实测表明:

  • 相较于 AVX512 INT8,Anolis-AMX-INT8 带来 8 倍整型性能提升。

  • 相较于 AVX512 BF16,Anolis-AMX-BF16 可以带来 16 倍浮点性能提升。

可以看到,基于 Anolis 搭配 AMX 技术可以极大提升 AI 业务能力。这只是 Anolis OS 对 SPR 进行垂直优化的一个简单示例,更多惊喜可以访问龙蜥官网查看。目前 SPR 平台已经上市,欢迎广大用户下载安装 Anolis OS,丝滑体验新平台 SPR!

Intel Arch SIG 主页:

https://openanolis.cn/sig/Intel-Kernel

龙蜥官网:

https://openanolis.cn/download

附:

2022 龙蜥社区全景白皮书(或公众号回复关键字“白皮书”获取)

https://openanolis.cn/openanoliswhitepaper

—— 完 ——

这篇关于龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/774306

相关文章

深入理解Apache Kafka(分布式流处理平台)

《深入理解ApacheKafka(分布式流处理平台)》ApacheKafka作为现代分布式系统中的核心中间件,为构建高吞吐量、低延迟的数据管道提供了强大支持,本文将深入探讨Kafka的核心概念、架构... 目录引言一、Apache Kafka概述1.1 什么是Kafka?1.2 Kafka的核心概念二、Ka

在Android平台上实现消息推送功能

《在Android平台上实现消息推送功能》随着移动互联网应用的飞速发展,消息推送已成为移动应用中不可或缺的功能,在Android平台上,实现消息推送涉及到服务端的消息发送、客户端的消息接收、通知渠道(... 目录一、项目概述二、相关知识介绍2.1 消息推送的基本原理2.2 Firebase Cloud Me

SpringKafka消息发布之KafkaTemplate与事务支持功能

《SpringKafka消息发布之KafkaTemplate与事务支持功能》通过本文介绍的基本用法、序列化选项、事务支持、错误处理和性能优化技术,开发者可以构建高效可靠的Kafka消息发布系统,事务支... 目录引言一、KafkaTemplate基础二、消息序列化三、事务支持机制四、错误处理与重试五、性能优

Java常用注解扩展对比举例详解

《Java常用注解扩展对比举例详解》:本文主要介绍Java常用注解扩展对比的相关资料,提供了丰富的代码示例,并总结了最佳实践建议,帮助开发者更好地理解和应用这些注解,需要的朋友可以参考下... 目录一、@Controller 与 @RestController 对比二、使用 @Data 与 不使用 @Dat

Spring组件初始化扩展点BeanPostProcessor的作用详解

《Spring组件初始化扩展点BeanPostProcessor的作用详解》本文通过实战案例和常见应用场景详细介绍了BeanPostProcessor的使用,并强调了其在Spring扩展中的重要性,感... 目录一、概述二、BeanPostProcessor的作用三、核心方法解析1、postProcessB

一文教你解决Python不支持中文路径的问题

《一文教你解决Python不支持中文路径的问题》Python是一种广泛使用的高级编程语言,然而在处理包含中文字符的文件路径时,Python有时会表现出一些不友好的行为,下面小编就来为大家介绍一下具体的... 目录问题背景解决方案1. 设置正确的文件编码2. 使用pathlib模块3. 转换路径为Unicod

Python中配置文件的全面解析与使用

《Python中配置文件的全面解析与使用》在Python开发中,配置文件扮演着举足轻重的角色,它们允许开发者在不修改代码的情况下调整应用程序的行为,下面我们就来看看常见Python配置文件格式的使用吧... 目录一、INI配置文件二、YAML配置文件三、jsON配置文件四、TOML配置文件五、XML配置文件

定价129元!支持双频 Wi-Fi 5的华为AX1路由器发布

《定价129元!支持双频Wi-Fi5的华为AX1路由器发布》华为上周推出了其最新的入门级Wi-Fi5路由器——华为路由AX1,建议零售价129元,这款路由器配置如何?详细请看下文介... 华为 Wi-Fi 5 路由 AX1 已正式开售,新品支持双频 1200 兆、配有四个千兆网口、提供可视化智能诊断功能,建

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个