GTC 22 精彩看点 | 锁定阿里云硬核分享

2023-11-11 08:30

本文主要是介绍GTC 22 精彩看点 | 锁定阿里云硬核分享,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

简介: 3月21日,2022英伟达 GTC 大会即将拉开帷幕。此次 GTC 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。

3月21日,2022英伟达 GTC 大会即将拉开帷幕。此次 GTC 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。

GTC 22 阿里云精彩演讲提前看

[S41068] PaiSparse:面向深度学习的稀疏加速库

· 李与超,阿里云,高级算法工程师

· 朱斐文,NVIDIA, 高级算法专家

· 3 月 23 日 星期三 | 3:00 PM - 3:25 PM 北京时间

随着超大语言模型的流行, 如何部署超大模型正在成为迫切需要解决的问题。非结构化剪枝可以将模型规模缩小99%,让超大语言模型在单卡上部署成为可能。然而超大模型稀疏后会呈现不同的非零分布,而这些分布会直接影响硬件的计算量并影响最终的执行时间。同时与传统的 HPC 任务不同的是,基于训练后的稀疏矩阵分布的 tuning 在深度学习推理中是可以进行的。因此我们提出一个面向深度学习的稀疏加速库:PaiSparse,可以自动生成更高效的稀疏算子。实验表明,与 cuSparse 相比,PaiSparse 可以提速1.5~5倍。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1634303703593001XjhX

[S41501] PTXC:使用 XLA 编译器通过云 GPU 扩展 PyTorch 训练

· 刘小勇,高级主任工程师

· 3 月 23 日 星期三 | 9:00 PM - 9:25 PM 北京时间

在工业界实践中,模型训练和部署的效率、规模和适配性关系到最终的应用效果。为满足PyTorch eager-first 的 GPU 编译流程,Lazy Tensor 架构被提出来。通过采用实践验证过的产品化 XLA 编译器和分布式引擎,PTXC 能在阿里云 GPU 集群中以基于编译优化的方式一键快速搭建易用、弹性且高效的 PyTorch 模型训练系统。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1637553159784001rkUB

[S41395] 通过 PAI-Blade 更易用、更可靠地使用 TensorRT

· 邱侠斐,阿里云,主任工程师

· 郭天佑,阿里云,高级工程师

· 李澜博,阿里云,高级工程师

· 3 月 24 日 星期四 | 9:00 AM - 9:25 AM 北京时间

TensorRT 是英伟达推出的业界领先的推理加速器,在深度学习推理场景应用广泛,但是通过 TensorRT 来优化深度学习模型仍有一定门槛。首先,通过 TensorRT 解析模型时会遇到转换失败或表现不理想的情况。其次,从零开始搭建网络比较耗时且难以扩展。此外,在生产环境里增加新的推理框架需要严谨的评估。本次演讲将介绍如何通过一站式 AI 加速器 PAI-Blade 解决上述问题。PAI-Blade 能够实现 TensorRT 后端上的自动圈图和自动化运行。同时还可以与 TensorRT Plugin 协同工作,以实现更好的性能。目前 PAI-Blade 提供对 TensorFlow 和 PyTorch 的产品化支持。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1635516028378001Pxlx

[S41604] 未来游戏趋势:通过阿里云弹性云手机解决方案打造云游戏

· 杨铭,阿里云,高级工程师

· 3 月 24 日 星期四|11:00 AM - 11:25 AM 北京时间

基于英伟达 T4 及原生的 ARM 平台,阿里云设计研发了高性能的云手游解决方案——弹性云手机,可实现虚拟化渲染及显存隔离,在确保隔离的情况下充分发挥 T4 性能。此外,弹性云手机无缝对接阿里巴巴云游戏流媒体平台,该平台兼容多种流媒体协议,并具备完整的“渲染-编码-串流”云手游架构。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1638429961776001IhJm

[S41383] 云端 Triton 生产实践

· 李文鹏,阿里云,主任工程师

· 邱侠斐,阿里云,主任工程师

· 李澜博,阿里云,高级工程师

· 3 月 24 日 星期四 | 1:00 PM - 1:25 PM 北京时间

Triton 推理服务器是一款功能全面、可扩展且功能强大的推理解决方案,在边缘设备和云上皆可部署。在云上将 Triton 部署到生产环境中时,应考虑效率、可扩展性以及与 Triton 自身外的云上基础设施的集成。我们将介绍在阿里云中通过 PAI- EAS 提供 Triton 作为云服务的关键见解:1) 一键部署 Triton 集群;2) 根据请求吞吐量扩展 Triton 集群;3) 与 OSS(对象存储服务)原生集成;以及 4) Triton 和 GPU 共享调度。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1635349148436001gNSE

[S41073] 阿里云基于 AI 编译器的通用透明性能解决方案

· 朱凯,阿里云,主任工程师

· 3 月 24 日 星期四 | 2:00 PM - 2:50 PM 北京时间

本次演讲将从云服务厂商的视角,分享在云端和机器学习平台上大规模部署 AI 编译器的实战经验。我们将详细介绍近期刚刚开源的动态 shape 深度学习编译器 BladeDISC,包括它的背景和主要特性,具体设计架构和实现细节,动态 shape 语义下的性能优化经验,未来计划以及在 NVIDIA 设备上的应用等。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1634431966251001JhrZ

GTC 22 阿里云精彩演讲锁定攻略!

1. 点击访问 GTC 22 官网  https://www.nvidia.cn/gtc-global/?ncid=GTC-NVMAGGIEJ

2. 注册 GTC 22

3. 登录后可将会议添加至会议日程如下图

4. 开始后登录即可观看会议,若错过直播时间,可登录查看会议点播,随时观看会议

扫描下方海报二维码,即刻注册 GTC 22,了解阿里云关于推理优化/部署、深度学习编译器、大模型部署、训练优化、云游戏等主题的精彩分享。

这篇关于GTC 22 精彩看点 | 锁定阿里云硬核分享的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/388812

相关文章

linux进程D状态的解决思路分享

《linux进程D状态的解决思路分享》在Linux系统中,进程在内核模式下等待I/O完成时会进入不间断睡眠状态(D状态),这种状态下,进程无法通过普通方式被杀死,本文通过实验模拟了这种状态,并分析了如... 目录1. 问题描述2. 问题分析3. 实验模拟3.1 使用losetup创建一个卷作为pv的磁盘3.

MySQL8.2.0安装教程分享

《MySQL8.2.0安装教程分享》这篇文章详细介绍了如何在Windows系统上安装MySQL数据库软件,包括下载、安装、配置和设置环境变量的步骤... 目录mysql的安装图文1.python访问网址2javascript.点击3.进入Downloads向下滑动4.选择Community Server5.

CentOS系统Maven安装教程分享

《CentOS系统Maven安装教程分享》本文介绍了如何在CentOS系统中安装Maven,并提供了一个简单的实际应用案例,安装Maven需要先安装Java和设置环境变量,Maven可以自动管理项目的... 目录准备工作下载并安装Maven常见问题及解决方法实际应用案例总结Maven是一个流行的项目管理工具

10个Python自动化办公的脚本分享

《10个Python自动化办公的脚本分享》在日常办公中,我们常常会被繁琐、重复的任务占据大量时间,本文为大家分享了10个实用的Python自动化办公案例及源码,希望对大家有所帮助... 目录1. 批量处理 Excel 文件2. 自动发送邮件3. 批量重命名文件4. 数据清洗5. 生成 PPT6. 自动化测试

10个Python Excel自动化脚本分享

《10个PythonExcel自动化脚本分享》在数据处理和分析的过程中,Excel文件是我们日常工作中常见的格式,本文将分享10个实用的Excel自动化脚本,希望可以帮助大家更轻松地掌握这些技能... 目录1. Excel单元格批量填充2. 设置行高与列宽3. 根据条件删除行4. 创建新的Excel工作表5

Redis多种内存淘汰策略及配置技巧分享

《Redis多种内存淘汰策略及配置技巧分享》本文介绍了Redis内存满时的淘汰机制,包括内存淘汰机制的概念,Redis提供的8种淘汰策略(如noeviction、volatile-lru等)及其适用场... 目录前言一、什么是 Redis 的内存淘汰机制?二、Redis 内存淘汰策略1. pythonnoe

Golang操作DuckDB实战案例分享

《Golang操作DuckDB实战案例分享》DuckDB是一个嵌入式SQL数据库引擎,它与众所周知的SQLite非常相似,但它是为olap风格的工作负载设计的,DuckDB支持各种数据类型和SQL特性... 目录DuckDB的主要优点环境准备初始化表和数据查询单行或多行错误处理和事务完整代码最后总结Duck

将Python应用部署到生产环境的小技巧分享

《将Python应用部署到生产环境的小技巧分享》文章主要讲述了在将Python应用程序部署到生产环境之前,需要进行的准备工作和最佳实践,包括心态调整、代码审查、测试覆盖率提升、配置文件优化、日志记录完... 目录部署前夜:从开发到生产的心理准备与检查清单环境搭建:打造稳固的应用运行平台自动化流水线:让部署像

C#读取本地网络配置信息全攻略分享

《C#读取本地网络配置信息全攻略分享》在当今数字化时代,网络已深度融入我们生活与工作的方方面面,对于软件开发而言,掌握本地计算机的网络配置信息显得尤为关键,而在C#编程的世界里,我们又该如何巧妙地读取... 目录一、引言二、C# 读取本地网络配置信息的基础准备2.1 引入关键命名空间2.2 理解核心类与方法

Golang使用etcd构建分布式锁的示例分享

《Golang使用etcd构建分布式锁的示例分享》在本教程中,我们将学习如何使用Go和etcd构建分布式锁系统,分布式锁系统对于管理对分布式系统中共享资源的并发访问至关重要,它有助于维护一致性,防止竞... 目录引言环境准备新建Go项目实现加锁和解锁功能测试分布式锁重构实现失败重试总结引言我们将使用Go作