Talk | 华为谢恩泽: PixArt-α, 基于Transformer的高质量文本到图像生成扩散模型的快速训练

本文主要是介绍Talk | 华为谢恩泽: PixArt-α, 基于Transformer的高质量文本到图像生成扩散模型的快速训练，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

本期为TechBeat人工智能社区第552期线上Talk。

北京时间11月30日(周四)20:00，华为诺亚方舟实验室·AI研究员—谢恩泽的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是: “PixArt-Alpha, 基于Transformer的高质量文本到图像生成的扩散模型的快速训练”，介绍了他们团队在基于Transformer的T2I扩散模型PIXART-α的一系列研究成果。

Talk·信息

▼

主题：PixArt-α, 基于Transformer的高质量文本到图像生成扩散模型的快速训练

嘉宾：华为诺亚方舟实验室AI研究员‍‍ 谢恩泽

时间：北京时间 11月30日(周四)20:00

地点：TechBeat人工智能社区

点击下方链接，即可观看视频！

TechBeatTechBeat是荟聚全球华人AI精英的成长社区，每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验，加速并陪伴其成长。https://www.techbeat.net/talk-info?id=830

Talk·介绍

▼

最先进的文本到图像(T2I)模型需要大量的训练成本(例如数百万个 GPU 小时)，严重阻碍了 AIGC 社区的根本创新，同时增加了二氧化碳排放。本文介绍了PIXART-α，一种基于Transformer的T2I扩散模型，其图像生成质量可与最先进的图像生成器(例如Imagen、SDXL甚至Midjourney)竞争，达到接近商业应用的标准。我们希望 PIXART-α 能为 AIGC 社区和初创公司提供新的见解，以加速从头开始构建自己的高质量且低成本的生成模型。

Talk大纲

1、背景: Diffusion Model和文生图的发展。

2、动机与问题: 现有的文生图模型训练成本非常高，如何高效训练文生图模型。

3、解决方案: 介绍PixArt-Alpha训练流程，实验结果等。

4、总结, 讨论FAQ。

Talk·预习资料

▼

项目链接：

https://pixart-alpha.github.io/

Demo链接：

https://huggingface.co/spaces/PixArt-alpha/PixArt-alpha

代码链接：

https://github.com/PixArt-alpha/PixArt-alpha

Talk·提问交流

▼

在Talk界面下的【交流区】参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

▼

谢恩泽

华为诺亚方舟实验室·AI研究员

谢恩泽，现华为诺亚方舟实验室(香港) AI Theory Lab的研究员，2022年毕业于香港大学MMLab，导师为罗平教授和王文平教授。目前研究方向主要是: (1)AIGC, e.g. Diffusion model for 2D/3D/video generation; (2)大语言模型(LLM), e.g. LLM长链条推理、AI4Math定理证明。

担任TPAMI, IJCV, CVPR, NeurIPS等多个国际会议/期刊审稿人。发表过20+篇顶级会议/期刊论文，如TPAMI, CVPR, ICCV, ICML, ICLR, NeurIPS, ACL等。其中8篇第一作者。其谷歌学术引用超过9000次，其中2篇论文单篇引用超过1500次。有4篇论文入选CVPR2020, ICCV2021, NeurIPS2021, ECCV2022的十大最具影响力论文。代表作SegFormer在英伟达GTC大会上介绍，被英伟达官方评价为一项富有远见的研究，研究成果广泛应用于国内外各大公司产品中(自动驾驶，医疗AI等)。

曾获2022年英伟达奖学金Finalist Award(全球15人)，世界人工智能大会WAIC2023优秀论文奖(全球10篇)。

个人主页:

TecBeat

关于TechBeat人工智能社区

▼

TechBeat(www.techbeat.net)隶属于将门创投，是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验，加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地，分享自己最新工作的沃土，在AI进阶之路上的升级打怪的根据地！

更多详细介绍>>TechBeat，一个荟聚全球华人AI精英的学习成长社区

这篇关于Talk | 华为谢恩泽: PixArt-α, 基于Transformer的高质量文本到图像生成扩散模型的快速训练的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！