龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台

本文主要是介绍龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文/尚旭春

Intel Sapphire Rapids(简称SPR)即第四代至强可扩展处理器,是 Intel 承上启下的一代产品。新引入增强指令、硬件加速器、 AMX 矩阵计算、SGX 机密计算、Scalable IOV、PCIe 5.0、CXL1.1 协议,涵盖了计算、安全、I/O 及虚拟化方面的众多技术升级和增强。 

龙蜥社区对 Intel 平台的支持一直领先于业界,紧随 Intel 研发节奏,基于 Intel Arch SIG 第一时间完成对 SPR 产品全面的支持,助力龙蜥用户以开箱即用的方式,享用新技术特性,整体支持情况如下图:

以上特性均在龙蜥社区得到全面支持:

加速器层面,Anolis 5.10 内核已经支持 DSA、IAA,配合龙蜥社区提供的 accel-config 用户态工具,用户可以对这两个加速器进行快速配置并使能。对于 QAT 和 DLB ,其驱动已经以 OOT 的形式发布于龙蜥社区,用户只需下载安装对应的 rpm 包即可享用新硬件加速带来的性能提升。

安全层面,龙蜥社区已经集成 SGX 的 SDK/PSW/DCAP 软件栈,并以 rpm 包形式发布,用户可以通过 Anolis 系统便捷部署自己的机密计算方案。

虚拟化层面,Anolis 内核率先支持 SIOV 特性,用户不论是使用 SPR 平台自带的硬件加速器,还是支持 SIOV 的第三方硬件,抑或是 DWQ/SWQ 的部署形式,都可以无感使用,真正做到了 One for All 。 

以下以对 AMX 指令的支持为例,介绍一下基于 Anolis 内核构建业务方案所带来的巨大性能提升:

Anolis 通过支持 AMX 指令并对其进行深层次的优化,搭建如图所示基于 Anolis 内核的深度学习方案,实测表明:

  • 相较于 AVX512 INT8,Anolis-AMX-INT8 带来 8 倍整型性能提升。

  • 相较于 AVX512 BF16,Anolis-AMX-BF16 可以带来 16 倍浮点性能提升。

可以看到,基于 Anolis 搭配 AMX 技术可以极大提升 AI 业务能力。这只是 Anolis OS 对 SPR 进行垂直优化的一个简单示例,更多惊喜可以访问龙蜥官网查看。目前 SPR 平台已经上市,欢迎广大用户下载安装 Anolis OS,丝滑体验新平台 SPR!

Intel Arch SIG 主页:

https://openanolis.cn/sig/Intel-Kernel

龙蜥官网:

https://openanolis.cn/download

附:

2022 龙蜥社区全景白皮书(或公众号回复关键字“白皮书”获取)

https://openanolis.cn/openanoliswhitepaper

—— 完 ——

这篇关于龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/774306

相关文章

SpringKafka消息发布之KafkaTemplate与事务支持功能

《SpringKafka消息发布之KafkaTemplate与事务支持功能》通过本文介绍的基本用法、序列化选项、事务支持、错误处理和性能优化技术,开发者可以构建高效可靠的Kafka消息发布系统,事务支... 目录引言一、KafkaTemplate基础二、消息序列化三、事务支持机制四、错误处理与重试五、性能优

Java常用注解扩展对比举例详解

《Java常用注解扩展对比举例详解》:本文主要介绍Java常用注解扩展对比的相关资料,提供了丰富的代码示例,并总结了最佳实践建议,帮助开发者更好地理解和应用这些注解,需要的朋友可以参考下... 目录一、@Controller 与 @RestController 对比二、使用 @Data 与 不使用 @Dat

Spring组件初始化扩展点BeanPostProcessor的作用详解

《Spring组件初始化扩展点BeanPostProcessor的作用详解》本文通过实战案例和常见应用场景详细介绍了BeanPostProcessor的使用,并强调了其在Spring扩展中的重要性,感... 目录一、概述二、BeanPostProcessor的作用三、核心方法解析1、postProcessB

一文教你解决Python不支持中文路径的问题

《一文教你解决Python不支持中文路径的问题》Python是一种广泛使用的高级编程语言,然而在处理包含中文字符的文件路径时,Python有时会表现出一些不友好的行为,下面小编就来为大家介绍一下具体的... 目录问题背景解决方案1. 设置正确的文件编码2. 使用pathlib模块3. 转换路径为Unicod

Python中配置文件的全面解析与使用

《Python中配置文件的全面解析与使用》在Python开发中,配置文件扮演着举足轻重的角色,它们允许开发者在不修改代码的情况下调整应用程序的行为,下面我们就来看看常见Python配置文件格式的使用吧... 目录一、INI配置文件二、YAML配置文件三、jsON配置文件四、TOML配置文件五、XML配置文件

定价129元!支持双频 Wi-Fi 5的华为AX1路由器发布

《定价129元!支持双频Wi-Fi5的华为AX1路由器发布》华为上周推出了其最新的入门级Wi-Fi5路由器——华为路由AX1,建议零售价129元,这款路由器配置如何?详细请看下文介... 华为 Wi-Fi 5 路由 AX1 已正式开售,新品支持双频 1200 兆、配有四个千兆网口、提供可视化智能诊断功能,建

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听