本文主要是介绍oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文章目录
- 在 CPU 和 GPU 上进行数值计算的高性能
- 为什么选择oneMKL?
- 最新消息
- 所需条件
- 特征
- 线性代数
- 稀疏线性代数函数
- 快速傅里叶变换 (FFT)
- 随机数生成器函数 (RNG)
- 数据拟合
- 矢量数学
- 汇总统计
英特尔® oneAPI 数学核心函数库 (oneMKL)可以加速数学处理例程,提高应用程序性能,并缩短开发时间。
在 CPU 和 GPU 上进行数值计算的高性能
快速、高效、易于使用的数学库
针对 Intel® CPU、GPU 和其他加速器进行了优化
多功能、强大的功能,用于:密集线性代数稀疏线性代数快速傅里叶变换 (FFT)矢量数学 (VM)随机数生成器 (RNG)汇总统计
为什么选择oneMKL?
适用于基于英特尔®的系统的最快和最常用的数学库。†
更快地创建高性能应用程序。
充分利用面向 AI、HPC 和数据科学的英特尔硬件功能。
从以前的解决方案(英特尔® MKL)无缝升级。
使用 NumPy、SciPy、MATLAB* 等数学解决方案实现高性能。
对 BLAS、LAPACK 和 FFTW 的全面标准接口支持。
最新消息
对 SYCL* 的 oneMKL 库进行了分区,以便为 oneMKL 的开发人员和用户提供更小的二进制占用空间
提高了英特尔 CPU 和 GPU 上的 CUDA* 库函数 API 兼容性覆盖率
提供针对英特尔®至强® CPU Max 系列和英特尔®数据中心 GPU Max 系列优化的高性能 LINPACK (HPL) 和 HPL-AI 基准测试
BLAS的
改进了英特尔数据中心 GPU Max 系列上 GEMV 和多个 BLAS 1 级例程的一般性能
DFT型
在英特尔数据中心 GPU Max 系列上支持大于 4 GiB(高达 64 GiB 数据)的 FFT
改进了英特尔数据中心 GPU Max 系列的 FFT 性能
拉包
引入 SYCL API,用于计算具有 C 和 Fortran OpenMP* 卸载支持的非枢轴 LU 分解
引入 SYCL API 来计算一组通用矩阵的批处理矩阵逆
矢量数学
将矢量数学优化集成到随机数生成器中,以实现高性能计算
支持 Intel GPU 上 FP16 数据类型的矢量数学运算
添加了 OpenMP 5.1 以支持 C 卸载
所需条件
首先为您的应用程序选择最佳接口:
C 接口
Fortran 接口
SYCL 接口
oneMKL 作为英特尔® oneAPI Base Toolkit 的一部分提供。
将 oneMKL 与英特尔® MPI 库或英特尔® Fortran 编译器结合使用需要英特尔® HPC 工具包。
特征
线性代数
使用对向量和矩阵进行操作的低级例程加速线性代数计算,并与以下行业标准的 BLAS 和 LAPACK 操作兼容:
第 1 级:向量-向量操作
第 2 级:矩阵向量运算
第 3 级:矩阵-矩阵运算
稀疏线性代数函数
使用低级和 inspector-executor 例程对稀疏矩阵执行各种操作,包括:
将稀疏矩阵与密集向量相乘
将稀疏矩阵乘以密集矩阵
使用三角稀疏矩阵求解线性系统
使用一般稀疏矩阵求解线性系统
快速傅里叶变换 (FFT)
将信号从其原始域(通常是时间或空间)转换为频域中的表示并返回。在一维、二维或三维中使用 FFT 函数,并支持混合 radice。支持的功能包括单精度和双精度任意长度的复数到复数和实数到复数的变换。
随机数生成器函数 (RNG)
使用常见的伪随机、准随机和非确定性随机数引擎来求解连续分布和离散分布。
数据拟合
提供基于样条的插值功能,可用于近似函数、函数导数或积分,以及执行单元格搜索操作。
矢量数学
通过基于矢量的基本函数平衡精度和性能。使用传统的代数和三角函数操作值。
汇总统计
计算单精度和双精度多维数据集的基本统计估计值(例如原始或中心总和矩)。
这篇关于oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!