oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间

本文主要是介绍oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 在 CPU 和 GPU 上进行数值计算的高性能
  • 为什么选择oneMKL?
  • 最新消息
  • 所需条件
  • 特征
    • 线性代数
    • 稀疏线性代数函数
    • 快速傅里叶变换 (FFT)
    • 随机数生成器函数 (RNG)
    • 数据拟合
    • 矢量数学
    • 汇总统计

英特尔® oneAPI 数学核心函数库 (oneMKL)可以加速数学处理例程,提高应用程序性能,并缩短开发时间。

在 CPU 和 GPU 上进行数值计算的高性能

快速、高效、易于使用的数学库
针对 Intel® CPU、GPU 和其他加速器进行了优化
多功能、强大的功能,用于:密集线性代数稀疏线性代数快速傅里叶变换 (FFT)矢量数学 (VM)随机数生成器 (RNG)汇总统计

为什么选择oneMKL?

适用于基于英特尔®的系统的最快和最常用的数学库。†
更快地创建高性能应用程序。
充分利用面向 AI、HPC 和数据科学的英特尔硬件功能。
从以前的解决方案(英特尔® MKL)无缝升级。
使用 NumPy、SciPy、MATLAB* 等数学解决方案实现高性能。
对 BLAS、LAPACK 和 FFTW 的全面标准接口支持。

最新消息

对 SYCL* 的 oneMKL 库进行了分区,以便为 oneMKL 的开发人员和用户提供更小的二进制占用空间
提高了英特尔 CPU 和 GPU 上的 CUDA* 库函数 API 兼容性覆盖率
提供针对英特尔®至强® CPU Max 系列和英特尔®数据中心 GPU Max 系列优化的高性能 LINPACK (HPL) 和 HPL-AI 基准测试
BLAS的
改进了英特尔数据中心 GPU Max 系列上 GEMV 和多个 BLAS 1 级例程的一般性能
DFT型
在英特尔数据中心 GPU Max 系列上支持大于 4 GiB(高达 64 GiB 数据)的 FFT
改进了英特尔数据中心 GPU Max 系列的 FFT 性能
拉包
引入 SYCL API,用于计算具有 C 和 Fortran OpenMP* 卸载支持的非枢轴 LU 分解
引入 SYCL API 来计算一组通用矩阵的批处理矩阵逆
矢量数学
将矢量数学优化集成到随机数生成器中,以实现高性能计算
支持 Intel GPU 上 FP16 数据类型的矢量数学运算
添加了 OpenMP 5.1 以支持 C 卸载

所需条件

首先为您的应用程序选择最佳接口:
C 接口
Fortran 接口
SYCL 接口

oneMKL 作为英特尔® oneAPI Base Toolkit 的一部分提供。
将 oneMKL 与英特尔® MPI 库或英特尔® Fortran 编译器结合使用需要英特尔® HPC 工具包。
在这里插入图片描述

特征

线性代数

使用对向量和矩阵进行操作的低级例程加速线性代数计算,并与以下行业标准的 BLAS 和 LAPACK 操作兼容:

第 1 级:向量-向量操作
第 2 级:矩阵向量运算
第 3 级:矩阵-矩阵运算

稀疏线性代数函数

使用低级和 inspector-executor 例程对稀疏矩阵执行各种操作,包括:

将稀疏矩阵与密集向量相乘
将稀疏矩阵乘以密集矩阵
使用三角稀疏矩阵求解线性系统
使用一般稀疏矩阵求解线性系统

快速傅里叶变换 (FFT)

将信号从其原始域(通常是时间或空间)转换为频域中的表示并返回。在一维、二维或三维中使用 FFT 函数,并支持混合 radice。支持的功能包括单精度和双精度任意长度的复数到复数和实数到复数的变换。

随机数生成器函数 (RNG)

使用常见的伪随机、准随机和非确定性随机数引擎来求解连续分布和离散分布。

数据拟合

提供基于样条的插值功能,可用于近似函数、函数导数或积分,以及执行单元格搜索操作。

矢量数学

通过基于矢量的基本函数平衡精度和性能。使用传统的代数和三角函数操作值。

汇总统计

计算单精度和双精度多维数据集的基本统计估计值(例如原始或中心总和矩)。

这篇关于oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/779877

相关文章

Spring Boot @RestControllerAdvice全局异常处理最佳实践

《SpringBoot@RestControllerAdvice全局异常处理最佳实践》本文详解SpringBoot中通过@RestControllerAdvice实现全局异常处理,强调代码复用、统... 目录前言一、为什么要使用全局异常处理?二、核心注解解析1. @RestControllerAdvice2

Golang如何对cron进行二次封装实现指定时间执行定时任务

《Golang如何对cron进行二次封装实现指定时间执行定时任务》:本文主要介绍Golang如何对cron进行二次封装实现指定时间执行定时任务问题,具有很好的参考价值,希望对大家有所帮助,如有错误... 目录背景cron库下载代码示例【1】结构体定义【2】定时任务开启【3】使用示例【4】控制台输出总结背景

SpringBoot开发中十大常见陷阱深度解析与避坑指南

《SpringBoot开发中十大常见陷阱深度解析与避坑指南》在SpringBoot的开发过程中,即使是经验丰富的开发者也难免会遇到各种棘手的问题,本文将针对SpringBoot开发中十大常见的“坑... 目录引言一、配置总出错?是不是同时用了.properties和.yml?二、换个位置配置就失效?搞清楚加

Python中对FFmpeg封装开发库FFmpy详解

《Python中对FFmpeg封装开发库FFmpy详解》:本文主要介绍Python中对FFmpeg封装开发库FFmpy,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录一、FFmpy简介与安装1.1 FFmpy概述1.2 安装方法二、FFmpy核心类与方法2.1 FF

详解MySQL中DISTINCT去重的核心注意事项

《详解MySQL中DISTINCT去重的核心注意事项》为了实现查询不重复的数据,MySQL提供了DISTINCT关键字,它的主要作用就是对数据表中一个或多个字段重复的数据进行过滤,只返回其中的一条数据... 目录DISTINCT 六大注意事项1. 作用范围:所有 SELECT 字段2. NULL 值的特殊处

基于Python开发Windows屏幕控制工具

《基于Python开发Windows屏幕控制工具》在数字化办公时代,屏幕管理已成为提升工作效率和保护眼睛健康的重要环节,本文将分享一个基于Python和PySide6开发的Windows屏幕控制工具,... 目录概述功能亮点界面展示实现步骤详解1. 环境准备2. 亮度控制模块3. 息屏功能实现4. 息屏时间

电脑提示xlstat4.dll丢失怎么修复? xlstat4.dll文件丢失处理办法

《电脑提示xlstat4.dll丢失怎么修复?xlstat4.dll文件丢失处理办法》长时间使用电脑,大家多少都会遇到类似dll文件丢失的情况,不过,解决这一问题其实并不复杂,下面我们就来看看xls... 在Windows操作系统中,xlstat4.dll是一个重要的动态链接库文件,通常用于支持各种应用程序

SQL Server数据库死锁处理超详细攻略

《SQLServer数据库死锁处理超详细攻略》SQLServer作为主流数据库管理系统,在高并发场景下可能面临死锁问题,影响系统性能和稳定性,这篇文章主要给大家介绍了关于SQLServer数据库死... 目录一、引言二、查询 Sqlserver 中造成死锁的 SPID三、用内置函数查询执行信息1. sp_w

Java对异常的认识与异常的处理小结

《Java对异常的认识与异常的处理小结》Java程序在运行时可能出现的错误或非正常情况称为异常,下面给大家介绍Java对异常的认识与异常的处理,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参... 目录一、认识异常与异常类型。二、异常的处理三、总结 一、认识异常与异常类型。(1)简单定义-什么是

Python并行处理实战之如何使用ProcessPoolExecutor加速计算

《Python并行处理实战之如何使用ProcessPoolExecutor加速计算》Python提供了多种并行处理的方式,其中concurrent.futures模块的ProcessPoolExecu... 目录简介完整代码示例代码解释1. 导入必要的模块2. 定义处理函数3. 主函数4. 生成数字列表5.