本文主要是介绍OFA one-for-all 通用多模态预训练模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
使用简单的序列到序列的学习框架 统一模态 (跨模态、视觉、语言等模态)和任务(如图片生成、视觉定位、图片描述、图片分类、文本生成等)
ICML 2022: 《OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework》
预训练当中的表征学习
(1)单模态的表征学习任务:
(2)跨模态的表征学习任务:
IO
训练推理
loss:交叉熵
推理:用前缀树的搜索策略替代beam search
前缀树
消融实验
这篇关于OFA one-for-all 通用多模态预训练模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!