首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
cogview专题
(2021|NIPS,VQ-VAE,精度瓶颈松弛,三明治层归一化,CapLoss)CogView:通过转换器掌握文本到图像的生成
CogView: Mastering Text-to-Image Generation via Transformers 公众号:EDPJ(添加 VX:CV_EDPJ 或直接进 Q 交流群:922230617 获取资料) 目录 0. 摘要 1. 简介 2. 方法 2.1 理论 2.2 标记化 2.3 自回归 Transformer 2.4 训练的稳定性 3. 微调 3.
阅读更多...
(2021|NIPS,VQ-VAE,精度瓶颈松弛,三明治层归一化,CapLoss)CogView:通过转换器掌握文本到图像的生成
CogView: Mastering Text-to-Image Generation via Transformers 公众号:EDPJ(添加 VX:CV_EDPJ 或直接进 Q 交流群:922230617 获取资料) 0. 摘要 通用领域中的文本到图像生成长期以来一直是一个悬而未决的问题,这需要强大的生成模型和跨模态理解。 我们提出了 CogView,一个具有 VQ-VAE 标记器的
阅读更多...
(2021|NIPS,)CogView:通过 Transformer 掌握文本到图像的生成
CogView: Mastering Text-to-Image Generation via Transformers 公众号:EDPJ(添加 VX:CV_EDPJ 或直接进 Q 交流群:922230617 获取资料) 0. 摘要 通用领域中的文本到图像生成长期以来一直是一个悬而未决的问题,这需要强大的生成模型和跨模态理解。 我们提出了 CogView,一个带有 VQ-VAE 标记器的
阅读更多...