GTC 22 精彩看点 | 锁定阿里云硬核分享

2023-11-11 08:30

本文主要是介绍GTC 22 精彩看点 | 锁定阿里云硬核分享,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

简介: 3月21日,2022英伟达 GTC 大会即将拉开帷幕。此次 GTC 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。

3月21日,2022英伟达 GTC 大会即将拉开帷幕。此次 GTC 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。

GTC 22 阿里云精彩演讲提前看

[S41068] PaiSparse:面向深度学习的稀疏加速库

· 李与超,阿里云,高级算法工程师

· 朱斐文,NVIDIA, 高级算法专家

· 3 月 23 日 星期三 | 3:00 PM - 3:25 PM 北京时间

随着超大语言模型的流行, 如何部署超大模型正在成为迫切需要解决的问题。非结构化剪枝可以将模型规模缩小99%,让超大语言模型在单卡上部署成为可能。然而超大模型稀疏后会呈现不同的非零分布,而这些分布会直接影响硬件的计算量并影响最终的执行时间。同时与传统的 HPC 任务不同的是,基于训练后的稀疏矩阵分布的 tuning 在深度学习推理中是可以进行的。因此我们提出一个面向深度学习的稀疏加速库:PaiSparse,可以自动生成更高效的稀疏算子。实验表明,与 cuSparse 相比,PaiSparse 可以提速1.5~5倍。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1634303703593001XjhX

[S41501] PTXC:使用 XLA 编译器通过云 GPU 扩展 PyTorch 训练

· 刘小勇,高级主任工程师

· 3 月 23 日 星期三 | 9:00 PM - 9:25 PM 北京时间

在工业界实践中,模型训练和部署的效率、规模和适配性关系到最终的应用效果。为满足PyTorch eager-first 的 GPU 编译流程,Lazy Tensor 架构被提出来。通过采用实践验证过的产品化 XLA 编译器和分布式引擎,PTXC 能在阿里云 GPU 集群中以基于编译优化的方式一键快速搭建易用、弹性且高效的 PyTorch 模型训练系统。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1637553159784001rkUB

[S41395] 通过 PAI-Blade 更易用、更可靠地使用 TensorRT

· 邱侠斐,阿里云,主任工程师

· 郭天佑,阿里云,高级工程师

· 李澜博,阿里云,高级工程师

· 3 月 24 日 星期四 | 9:00 AM - 9:25 AM 北京时间

TensorRT 是英伟达推出的业界领先的推理加速器,在深度学习推理场景应用广泛,但是通过 TensorRT 来优化深度学习模型仍有一定门槛。首先,通过 TensorRT 解析模型时会遇到转换失败或表现不理想的情况。其次,从零开始搭建网络比较耗时且难以扩展。此外,在生产环境里增加新的推理框架需要严谨的评估。本次演讲将介绍如何通过一站式 AI 加速器 PAI-Blade 解决上述问题。PAI-Blade 能够实现 TensorRT 后端上的自动圈图和自动化运行。同时还可以与 TensorRT Plugin 协同工作,以实现更好的性能。目前 PAI-Blade 提供对 TensorFlow 和 PyTorch 的产品化支持。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1635516028378001Pxlx

[S41604] 未来游戏趋势:通过阿里云弹性云手机解决方案打造云游戏

· 杨铭,阿里云,高级工程师

· 3 月 24 日 星期四|11:00 AM - 11:25 AM 北京时间

基于英伟达 T4 及原生的 ARM 平台,阿里云设计研发了高性能的云手游解决方案——弹性云手机,可实现虚拟化渲染及显存隔离,在确保隔离的情况下充分发挥 T4 性能。此外,弹性云手机无缝对接阿里巴巴云游戏流媒体平台,该平台兼容多种流媒体协议,并具备完整的“渲染-编码-串流”云手游架构。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1638429961776001IhJm

[S41383] 云端 Triton 生产实践

· 李文鹏,阿里云,主任工程师

· 邱侠斐,阿里云,主任工程师

· 李澜博,阿里云,高级工程师

· 3 月 24 日 星期四 | 1:00 PM - 1:25 PM 北京时间

Triton 推理服务器是一款功能全面、可扩展且功能强大的推理解决方案,在边缘设备和云上皆可部署。在云上将 Triton 部署到生产环境中时,应考虑效率、可扩展性以及与 Triton 自身外的云上基础设施的集成。我们将介绍在阿里云中通过 PAI- EAS 提供 Triton 作为云服务的关键见解:1) 一键部署 Triton 集群;2) 根据请求吞吐量扩展 Triton 集群;3) 与 OSS(对象存储服务)原生集成;以及 4) Triton 和 GPU 共享调度。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1635349148436001gNSE

[S41073] 阿里云基于 AI 编译器的通用透明性能解决方案

· 朱凯,阿里云,主任工程师

· 3 月 24 日 星期四 | 2:00 PM - 2:50 PM 北京时间

本次演讲将从云服务厂商的视角,分享在云端和机器学习平台上大规模部署 AI 编译器的实战经验。我们将详细介绍近期刚刚开源的动态 shape 深度学习编译器 BladeDISC,包括它的背景和主要特性,具体设计架构和实现细节,动态 shape 语义下的性能优化经验,未来计划以及在 NVIDIA 设备上的应用等。

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1634431966251001JhrZ

GTC 22 阿里云精彩演讲锁定攻略!

1. 点击访问 GTC 22 官网  https://www.nvidia.cn/gtc-global/?ncid=GTC-NVMAGGIEJ

2. 注册 GTC 22

3. 登录后可将会议添加至会议日程如下图

4. 开始后登录即可观看会议,若错过直播时间,可登录查看会议点播,随时观看会议

扫描下方海报二维码,即刻注册 GTC 22,了解阿里云关于推理优化/部署、深度学习编译器、大模型部署、训练优化、云游戏等主题的精彩分享。

这篇关于GTC 22 精彩看点 | 锁定阿里云硬核分享的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/388812

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

java常用面试题-基础知识分享

什么是Java? Java是一种高级编程语言,旨在提供跨平台的解决方案。它是一种面向对象的语言,具有简单、结构化、可移植、可靠、安全等特点。 Java的主要特点是什么? Java的主要特点包括: 简单性:Java的语法相对简单,易于学习和使用。面向对象:Java是一种完全面向对象的语言,支持封装、继承和多态。跨平台性:Java的程序可以在不同的操作系统上运行,称为"Write once,

分享5款免费录屏的工具,搞定网课不怕错过!

虽然现在学生们不怎么上网课, 但是对于上班族或者是没有办法到学校参加课程的人来说,网课还是很重要的,今天,我就来跟大家分享一下我用过的几款录屏软件=,看看它们在录制网课时的表现如何。 福昕录屏大师 网址:https://www.foxitsoftware.cn/REC/ 这款软件给我的第一印象就是界面简洁,操作起来很直观。它支持全屏录制,也支持区域录制,这对于我这种需要同时录制PPT和老师讲

MySQL中一致性非锁定读

一致性非锁定读(consistent nonlocking read)是指InnoDB存储引擎通过多版本控制(multi versionning)的方式来读取当前执行时间数据库中行的数据,如果读取的行正在执行DELETE或UPDATE操作,这是读取操作不会因此等待行上锁的释放。相反的,InnoDB会去读取行的一个快照数据 上面展示了InnoDB存储引擎一致性的非锁定读。之所以称为非锁定读,因

【干货分享】基于SSM的体育场管理系统的开题报告(附源码下载地址)

中秋送好礼 中秋佳节将至,祝福大家中秋快乐,阖家幸福。本期免费分享毕业设计作品:《基于SSM的体育场管理系统》。 基于SSM的体育场管理系统的开题报告 一、课题背景与意义 随着全民健身理念的深入人心,体育场已成为广大师生和社区居民进行体育锻炼的重要场所。然而,传统的体育场管理方式存在诸多问题,如资源分配不均、预约流程繁琐、数据统计不准确等,严重影响了体育场的使用效率和用户体验。

阿里云服务器ces

允许公网通过 HTTP、HTTPS 等服务访问实例 https://help.aliyun.com/document_detail/25475.html?spm=5176.2020520101.0.0.3ca96b0b3KGTPq#allowHttp

图书管理系统系统分享

分享一个图书管理系统,Java、SpringBoot、Vue和MySQL开发的图书馆管理系统 gitee项目地址:https://gitee.com/yuanmomoya/open-source-project/tree/master/books-management-system GitHub项目地址:https://github.com/yuanmomoya/open-source-pro

LLM系列 | 38:解读阿里开源语音多模态模型Qwen2-Audio

引言 模型概述 模型架构 训练方法 性能评估 实战演示 总结 引言 金山挂月窥禅径,沙鸟听经恋法门。 小伙伴们好,我是微信公众号《小窗幽记机器学习》的小编:卖铁观音的小男孩,今天这篇小作文主要是介绍阿里巴巴的语音多模态大模型Qwen2-Audio。近日,阿里巴巴Qwen团队发布了最新的大规模音频-语言模型Qwen2-Audio及其技术报告。该模型在音频理解和多模态交互