oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间

本文主要是介绍oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 在 CPU 和 GPU 上进行数值计算的高性能
  • 为什么选择oneMKL?
  • 最新消息
  • 所需条件
  • 特征
    • 线性代数
    • 稀疏线性代数函数
    • 快速傅里叶变换 (FFT)
    • 随机数生成器函数 (RNG)
    • 数据拟合
    • 矢量数学
    • 汇总统计

英特尔® oneAPI 数学核心函数库 (oneMKL)可以加速数学处理例程,提高应用程序性能,并缩短开发时间。

在 CPU 和 GPU 上进行数值计算的高性能

快速、高效、易于使用的数学库
针对 Intel® CPU、GPU 和其他加速器进行了优化
多功能、强大的功能,用于:密集线性代数稀疏线性代数快速傅里叶变换 (FFT)矢量数学 (VM)随机数生成器 (RNG)汇总统计

为什么选择oneMKL?

适用于基于英特尔®的系统的最快和最常用的数学库。†
更快地创建高性能应用程序。
充分利用面向 AI、HPC 和数据科学的英特尔硬件功能。
从以前的解决方案(英特尔® MKL)无缝升级。
使用 NumPy、SciPy、MATLAB* 等数学解决方案实现高性能。
对 BLAS、LAPACK 和 FFTW 的全面标准接口支持。

最新消息

对 SYCL* 的 oneMKL 库进行了分区,以便为 oneMKL 的开发人员和用户提供更小的二进制占用空间
提高了英特尔 CPU 和 GPU 上的 CUDA* 库函数 API 兼容性覆盖率
提供针对英特尔®至强® CPU Max 系列和英特尔®数据中心 GPU Max 系列优化的高性能 LINPACK (HPL) 和 HPL-AI 基准测试
BLAS的
改进了英特尔数据中心 GPU Max 系列上 GEMV 和多个 BLAS 1 级例程的一般性能
DFT型
在英特尔数据中心 GPU Max 系列上支持大于 4 GiB(高达 64 GiB 数据)的 FFT
改进了英特尔数据中心 GPU Max 系列的 FFT 性能
拉包
引入 SYCL API,用于计算具有 C 和 Fortran OpenMP* 卸载支持的非枢轴 LU 分解
引入 SYCL API 来计算一组通用矩阵的批处理矩阵逆
矢量数学
将矢量数学优化集成到随机数生成器中,以实现高性能计算
支持 Intel GPU 上 FP16 数据类型的矢量数学运算
添加了 OpenMP 5.1 以支持 C 卸载

所需条件

首先为您的应用程序选择最佳接口:
C 接口
Fortran 接口
SYCL 接口

oneMKL 作为英特尔® oneAPI Base Toolkit 的一部分提供。
将 oneMKL 与英特尔® MPI 库或英特尔® Fortran 编译器结合使用需要英特尔® HPC 工具包。
在这里插入图片描述

特征

线性代数

使用对向量和矩阵进行操作的低级例程加速线性代数计算,并与以下行业标准的 BLAS 和 LAPACK 操作兼容:

第 1 级:向量-向量操作
第 2 级:矩阵向量运算
第 3 级:矩阵-矩阵运算

稀疏线性代数函数

使用低级和 inspector-executor 例程对稀疏矩阵执行各种操作,包括:

将稀疏矩阵与密集向量相乘
将稀疏矩阵乘以密集矩阵
使用三角稀疏矩阵求解线性系统
使用一般稀疏矩阵求解线性系统

快速傅里叶变换 (FFT)

将信号从其原始域(通常是时间或空间)转换为频域中的表示并返回。在一维、二维或三维中使用 FFT 函数,并支持混合 radice。支持的功能包括单精度和双精度任意长度的复数到复数和实数到复数的变换。

随机数生成器函数 (RNG)

使用常见的伪随机、准随机和非确定性随机数引擎来求解连续分布和离散分布。

数据拟合

提供基于样条的插值功能,可用于近似函数、函数导数或积分,以及执行单元格搜索操作。

矢量数学

通过基于矢量的基本函数平衡精度和性能。使用传统的代数和三角函数操作值。

汇总统计

计算单精度和双精度多维数据集的基本统计估计值(例如原始或中心总和矩)。

这篇关于oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/779877

相关文章

JAVA系统中Spring Boot应用程序的配置文件application.yml使用详解

《JAVA系统中SpringBoot应用程序的配置文件application.yml使用详解》:本文主要介绍JAVA系统中SpringBoot应用程序的配置文件application.yml的... 目录文件路径文件内容解释1. Server 配置2. Spring 配置3. Logging 配置4. Ma

基于Python开发电脑定时关机工具

《基于Python开发电脑定时关机工具》这篇文章主要为大家详细介绍了如何基于Python开发一个电脑定时关机工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 简介2. 运行效果3. 相关源码1. 简介这个程序就像一个“忠实的管家”,帮你按时关掉电脑,而且全程不需要你多做

C#使用yield关键字实现提升迭代性能与效率

《C#使用yield关键字实现提升迭代性能与效率》yield关键字在C#中简化了数据迭代的方式,实现了按需生成数据,自动维护迭代状态,本文主要来聊聊如何使用yield关键字实现提升迭代性能与效率,感兴... 目录前言传统迭代和yield迭代方式对比yield延迟加载按需获取数据yield break显式示迭

使用C#代码计算数学表达式实例

《使用C#代码计算数学表达式实例》这段文字主要讲述了如何使用C#语言来计算数学表达式,该程序通过使用Dictionary保存变量,定义了运算符优先级,并实现了EvaluateExpression方法来... 目录C#代码计算数学表达式该方法很长,因此我将分段描述下面的代码片段显示了下一步以下代码显示该方法如

Go语言使用Buffer实现高性能处理字节和字符

《Go语言使用Buffer实现高性能处理字节和字符》在Go中,bytes.Buffer是一个非常高效的类型,用于处理字节数据的读写操作,本文将详细介绍一下如何使用Buffer实现高性能处理字节和... 目录1. bytes.Buffer 的基本用法1.1. 创建和初始化 Buffer1.2. 使用 Writ

Java中的Opencv简介与开发环境部署方法

《Java中的Opencv简介与开发环境部署方法》OpenCV是一个开源的计算机视觉和图像处理库,提供了丰富的图像处理算法和工具,它支持多种图像处理和计算机视觉算法,可以用于物体识别与跟踪、图像分割与... 目录1.Opencv简介Opencv的应用2.Java使用OpenCV进行图像操作opencv安装j

Python视频处理库VidGear使用小结

《Python视频处理库VidGear使用小结》VidGear是一个高性能的Python视频处理库,本文主要介绍了Python视频处理库VidGear使用小结,文中通过示例代码介绍的非常详细,对大家的... 目录一、VidGear的安装二、VidGear的主要功能三、VidGear的使用示例四、VidGea

Python结合requests和Cheerio处理网页内容的操作步骤

《Python结合requests和Cheerio处理网页内容的操作步骤》Python因其简洁明了的语法和强大的库支持,成为了编写爬虫程序的首选语言之一,requests库是Python中用于发送HT... 目录一、前言二、环境搭建三、requests库的基本使用四、Cheerio库的基本使用五、结合req

使用Python处理CSV和Excel文件的操作方法

《使用Python处理CSV和Excel文件的操作方法》在数据分析、自动化和日常开发中,CSV和Excel文件是非常常见的数据存储格式,ython提供了强大的工具来读取、编辑和保存这两种文件,满足从基... 目录1. CSV 文件概述和处理方法1.1 CSV 文件格式的基本介绍1.2 使用 python 内

Python 标准库time时间的访问和转换问题小结

《Python标准库time时间的访问和转换问题小结》time模块为Python提供了处理时间和日期的多种功能,适用于多种与时间相关的场景,包括获取当前时间、格式化时间、暂停程序执行、计算程序运行时... 目录模块介绍使用场景主要类主要函数 - time()- sleep()- localtime()- g