VECO:对于语言的理解和生成的灵活多变跨语言模型的预训练

2024-06-21 07:48

本文主要是介绍VECO:对于语言的理解和生成的灵活多变跨语言模型的预训练,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

VECO:对于语言的理解和生成的灵活多变跨语言模型的预训练

本文包括

1.为什么提出VECO
2.怎么训练VECO
3.VECO的结果
4.结论

为什么提出VECO
跨语言训练的背景

从预训练任务的角度
在这里插入图片描述
VECO预训练的任务
我们建议将交叉注意模块(query!=key/value)插入Transformer编码器和设计一个交叉注意的MLM任务,“明确地”捕捉语言之间的相互依赖。
在这里插入图片描述

背景:预训练的跨语言模型
从模型体系结构的角度看:

在这里插入图片描述
VECO微调:灵活的NLU和NLG任务
在这里插入图片描述
怎样去训练VECO
encoder-decoder VECO:变量
VECO为每个token构建两种类型的表示:

一套上下文表示记为H,表示因为绿色方块和黄色方块只建立在自注意模块上(即plug-in the

cross-attention module)。

另一套情境表示S,表示为混合颜色块,构建在自注意和交叉注意模块(即plug-in the

cross-attention module)。
在这里插入图片描述

预训练任务:自注意的预训练
目标:根据单语语境预测隐藏的单词

在这里插入图片描述
预训练任务:自注意+交叉注意的预训练
目标:根据双语语境预测隐藏的单词

在这里插入图片描述

VECO的结果
实验装置

在这里插入图片描述
NLU任务——XTREME排行榜
在这里插入图片描述
NLG 任务— 在 WMT 数据集上的机器翻译
在这里插入图片描述
总结
结论

•VECO是一种可变且灵活的跨语言预训练模型,目标是“明确”捕捉语言之间的相互依赖,通过交叉注意模块实现。

•基于灵活的特性,VECO可以初始化两个NLU首选编码器transformer和NLG专用编码器-解码器transformer。

•此外,我们还引入了一个插件微调方法,以鼓励两者之间的融合结合VECO和跨语言下游任务的特点。

•VECO在各种跨语言NLU和NLG任务上实现了持续的改进,拓宽了对预训练的骨干结构和微调在跨语言情景下的方法。

AliceMind:阿里巴巴头脑实验室的编码器-解码器集合
在这里插入图片描述

这篇关于VECO:对于语言的理解和生成的灵活多变跨语言模型的预训练的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080622

相关文章

Java编译生成多个.class文件的原理和作用

《Java编译生成多个.class文件的原理和作用》作为一名经验丰富的开发者,在Java项目中执行编译后,可能会发现一个.java源文件有时会产生多个.class文件,从技术实现层面详细剖析这一现象... 目录一、内部类机制与.class文件生成成员内部类(常规内部类)局部内部类(方法内部类)匿名内部类二、

使用Jackson进行JSON生成与解析的新手指南

《使用Jackson进行JSON生成与解析的新手指南》这篇文章主要为大家详细介绍了如何使用Jackson进行JSON生成与解析处理,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 核心依赖2. 基础用法2.1 对象转 jsON(序列化)2.2 JSON 转对象(反序列化)3.

java中使用POI生成Excel并导出过程

《java中使用POI生成Excel并导出过程》:本文主要介绍java中使用POI生成Excel并导出过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录需求说明及实现方式需求完成通用代码版本1版本2结果展示type参数为atype参数为b总结注:本文章中代码均为

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

在java中如何将inputStream对象转换为File对象(不生成本地文件)

《在java中如何将inputStream对象转换为File对象(不生成本地文件)》:本文主要介绍在java中如何将inputStream对象转换为File对象(不生成本地文件),具有很好的参考价... 目录需求说明问题解决总结需求说明在后端中通过POI生成Excel文件流,将输出流(outputStre

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

C语言中的数据类型强制转换

《C语言中的数据类型强制转换》:本文主要介绍C语言中的数据类型强制转换方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C语言数据类型强制转换自动转换强制转换类型总结C语言数据类型强制转换强制类型转换:是通过类型转换运算来实现的,主要的数据类型转换分为自动转换

利用Go语言开发文件操作工具轻松处理所有文件

《利用Go语言开发文件操作工具轻松处理所有文件》在后端开发中,文件操作是一个非常常见但又容易出错的场景,本文小编要向大家介绍一个强大的Go语言文件操作工具库,它能帮你轻松处理各种文件操作场景... 目录为什么需要这个工具?核心功能详解1. 文件/目录存javascript在性检查2. 批量创建目录3. 文件

C语言实现两个变量值交换的三种方式

《C语言实现两个变量值交换的三种方式》两个变量值的交换是编程中最常见的问题之一,以下将介绍三种变量的交换方式,其中第一种方式是最常用也是最实用的,后两种方式一般只在特殊限制下使用,需要的朋友可以参考下... 目录1.使用临时变量(推荐)2.相加和相减的方式(值较大时可能丢失数据)3.按位异或运算1.使用临时

使用C语言实现交换整数的奇数位和偶数位

《使用C语言实现交换整数的奇数位和偶数位》在C语言中,要交换一个整数的二进制位中的奇数位和偶数位,重点需要理解位操作,当我们谈论二进制位的奇数位和偶数位时,我们是指从右到左数的位置,本文给大家介绍了使... 目录一、问题描述二、解决思路三、函数实现四、宏实现五、总结一、问题描述使用C语言代码实现:将一个整