注意力机制:点积、通用、缩放点积、拼接、相加

2023-12-28 06:32

本文主要是介绍注意力机制:点积、通用、缩放点积、拼接、相加,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

自 然 语 言 推 理 (Natural Language Inference,NLI)任务中相对应的 句子等。如果将下游任务抽象成查询(query),就可 以归纳出注意力机制的通用形式,即将源文本看成 是键-值对序列,用K=(k1,…,kN )V=(v1,…,vN )分 别表示键序列值序列,用 Q=(q1,…,qM)表示查询序列,那么针对查询的注意力可以被描述为键-值对序列在该查询上的映射 。如图2所示,计算过程可分为三步:

(1)计算查询 和每个键 的注意力得分,常 用的计算方法包括

点积[7] 、

缩放点积[6] 、

拼接[7] 以及

相加[3] 等,如公式(1)所示;

(2)使用 Softmax 等函数对注意力得分归一 化处理,得到每个键的权重,如公式(2)所示;

(3)将权重和其对应的值加权求和作为注 意力输出,如公式(3)所示。

其中,W 和 U 代表可学习的参数矩阵,v代表参数向量。 

 

键−值对是源文本的组成元素,可以是字符、词、 短语、句子等,甚至是它们的组合[8] 。这些元素一般 用向量表示,向量不仅是元素的内容表示,同时也是 元素的唯一标识,在通常情况下 K=V。模型输出的 注意力是源文本序列基于查询 qt的表示,不同的查 询会给源文本序列带来不同的权重分布。注意力机制根据查询计算出源文本序列中与下游任务最相关 的部分,意味着不同的查询会关注源文本的不同部 分,因此注意力机制可以看成是一种基于查询源文本表示方法,理论上适用于任何文本处理任务。 

这篇关于注意力机制:点积、通用、缩放点积、拼接、相加的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/545234

相关文章

Nginx之upstream被动式重试机制的实现

《Nginx之upstream被动式重试机制的实现》本文主要介绍了Nginx之upstream被动式重试机制的实现,可以通过proxy_next_upstream来自定义配置,具有一定的参考价值,感兴... 目录默认错误选择定义错误指令配置proxy_next_upstreamproxy_next_upst

Spring排序机制之接口与注解的使用方法

《Spring排序机制之接口与注解的使用方法》本文介绍了Spring中多种排序机制,包括Ordered接口、PriorityOrdered接口、@Order注解和@Priority注解,提供了详细示例... 目录一、Spring 排序的需求场景二、Spring 中的排序机制1、Ordered 接口2、Pri

Java实战之自助进行多张图片合成拼接

《Java实战之自助进行多张图片合成拼接》在当今数字化时代,图像处理技术在各个领域都发挥着至关重要的作用,本文为大家详细介绍了如何使用Java实现多张图片合成拼接,需要的可以了解下... 目录前言一、图片合成需求描述二、图片合成设计与实现1、编程语言2、基础数据准备3、图片合成流程4、图片合成实现三、总结前

MySQL 缓存机制与架构解析(最新推荐)

《MySQL缓存机制与架构解析(最新推荐)》本文详细介绍了MySQL的缓存机制和整体架构,包括一级缓存(InnoDBBufferPool)和二级缓存(QueryCache),文章还探讨了SQL... 目录一、mysql缓存机制概述二、MySQL整体架构三、SQL查询执行全流程四、MySQL 8.0为何移除查

一文详解Java Condition的await和signal等待通知机制

《一文详解JavaCondition的await和signal等待通知机制》这篇文章主要为大家详细介绍了JavaCondition的await和signal等待通知机制的相关知识,文中的示例代码讲... 目录1. Condition的核心方法2. 使用场景与优势3. 使用流程与规范基本模板生产者-消费者示例

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

一文带你理解Python中import机制与importlib的妙用

《一文带你理解Python中import机制与importlib的妙用》在Python编程的世界里,import语句是开发者最常用的工具之一,它就像一把钥匙,打开了通往各种功能和库的大门,下面就跟随小... 目录一、python import机制概述1.1 import语句的基本用法1.2 模块缓存机制1.

基于WinForm+Halcon实现图像缩放与交互功能

《基于WinForm+Halcon实现图像缩放与交互功能》本文主要讲述在WinForm中结合Halcon实现图像缩放、平移及实时显示灰度值等交互功能,包括初始化窗口的不同方式,以及通过特定事件添加相应... 目录前言初始化窗口添加图像缩放功能添加图像平移功能添加实时显示灰度值功能示例代码总结最后前言本文将

Redis主从/哨兵机制原理分析

《Redis主从/哨兵机制原理分析》本文介绍了Redis的主从复制和哨兵机制,主从复制实现了数据的热备份和负载均衡,而哨兵机制可以监控Redis集群,实现自动故障转移,哨兵机制通过监控、下线、选举和故... 目录一、主从复制1.1 什么是主从复制1.2 主从复制的作用1.3 主从复制原理1.3.1 全量复制

Redis缓存问题与缓存更新机制详解

《Redis缓存问题与缓存更新机制详解》本文主要介绍了缓存问题及其解决方案,包括缓存穿透、缓存击穿、缓存雪崩等问题的成因以及相应的预防和解决方法,同时,还详细探讨了缓存更新机制,包括不同情况下的缓存更... 目录一、缓存问题1.1 缓存穿透1.1.1 问题来源1.1.2 解决方案1.2 缓存击穿1.2.1