Mxnet (19): 循环神经网络(RNN)上

2024-04-17 19:58
文章标签 神经网络 循环 19 rnn mxnet

本文主要是介绍Mxnet (19): 循环神经网络(RNN)上,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在生活中经常能够遇见序列数据,有些是根据时间更改,例如天气,股票,经济指数等,有些是有上下文关联的,如音乐、文章。为了更好的处理这些数据,从业工作者设计出了循环神经网络。它通过引入状态变量来存储过去的信息,并通过其与输入共同决定当前输出,咋感觉有点像残差块。

循环神经网络常用于处理序列数据,如一段文字或声音、购物或观影的顺序,甚至是图像中的一行或一列像素。因此,循环神经网络有这广泛的实际应用,如语音模型、文本分类、机器翻译、语音识别、图像分析、手写识别和推荐系统。

许多循环网络的示例都是基于文本数据。主要介绍模型。

1. 序列模型

对序列数据往往没有我们想象的那么简单,能够更好的理解序列:

  • 涉及到打开程序的时间,许多用户会有非常特殊的行为。如社交媒体应用在放学后更受到学生的欢迎。当市场开放时,股票交易软件使用更频繁。
  • 预测明天的股价要比推算昨天遗漏的股价要难得多,远见要比后见难得多,马后炮还是好放的。预测超出已知的观测值称为外推法,估计现有观测值之间称为内插法。
  • 音乐、语音、文字和视频本质上都是有顺序的。如果我们将他们的顺序调换,他们的意义就变了,如牛吃草和草吃牛,意义完全不一样。
  • 地震之间的相关性很强,即在发生大地震后,很可能会发生几次较小的余震,比没有发生强烈的余震要严重的多。实际上,地震是时空相关的,也就是说,余震通常发生在很短的时间范围内并且非常接近。
  • 人与人之间的互动也是具有时序的,如辩论,battle。

1.1 统计工具

对于序列模型的处理,需要对应的统计工具。

假设通过如下方程预测t位置的值 x t x_t xt

x t ∼ P ( x t ∣ x t − 1 , … , x 1 ) x_t∼P(x_t∣x_{t−1},…,x_1) xtP(xtxt1,,x1)

1.1.1 自回归模型

为了实现预测,可以使用回归模型。这里存在一个问题就是:输入的数量取决于t。就是说如果数据量越大那么输入量也就跟着变大,因此输入值无法确定,处理这个问题有如下两种思路:

  • 设定一个定长τ,只通过 x t − 1 , … , x t − τ x_{t−1},…,x_{t−τ} xt1,,xtτ 观察。这样做的好处是,在t>τ,输入数量可以确定。这样的模型被称为自回归模型,因为他们实际上是对其自身进行回归。
  • 通过对之前数据进行总结。 h t h_t ht是过去的数据,在预测 x ^ t \hat{x}_t x^t时,也更新 h t h_t ht。这样模型通过 x ^ t = P ( x t ∣ h t ) \hat{x}_t = P(x_t \mid h_{t}) x^t=P(xtht)和不断更新的 h t = g ( h t − 1 , x t − 1 ) h_t=g(h_{t−1},x_{t−1}) ht=g(ht1,xt1)预测 x t x_t xt。由于自始至终 h t h_t ht都没有被观测到,这个模型也称为潜在自回归模型。

在这里插入图片描述

那么如何生成训练数据呢,到目前为止都是通过使用历史观测值来预测下一个观测值。假设序列 w 1 w_1 w1, w 2 w_2 w2,…, w T w_T wT中的每个词是依次生成的:

P ( x 1 , … , x T ) = ∏ t = 1 T P ( x t ∣ x t − 1 , … , x 1 ) P(x_1, \ldots, x_T) = \prod_{t=1}^T P(x_t \mid x_{t-1}, \ldots, x_1) P(x1,,xT)=t=1TP(xtxt1,,x1)

一段含有4个词的文本序列的概率:
P ( w 1 , w 2 , w 3 , w 4 ) = P ( w 1 ) P ( w 2 ∣ w 1 ) P ( w 3 ∣ w

这篇关于Mxnet (19): 循环神经网络(RNN)上的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/912701

相关文章

Python判断for循环最后一次的6种方法

《Python判断for循环最后一次的6种方法》在Python中,通常我们不会直接判断for循环是否正在执行最后一次迭代,因为Python的for循环是基于可迭代对象的,它不知道也不关心迭代的内部状态... 目录1.使用enuhttp://www.chinasem.cnmerate()和len()来判断for

Java循环创建对象内存溢出的解决方法

《Java循环创建对象内存溢出的解决方法》在Java中,如果在循环中不当地创建大量对象而不及时释放内存,很容易导致内存溢出(OutOfMemoryError),所以本文给大家介绍了Java循环创建对象... 目录问题1. 解决方案2. 示例代码2.1 原始版本(可能导致内存溢出)2.2 修改后的版本问题在

JAVA中while循环的使用与注意事项

《JAVA中while循环的使用与注意事项》:本文主要介绍while循环在编程中的应用,包括其基本结构、语句示例、适用场景以及注意事项,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录while循环1. 什么是while循环2. while循环的语句3.while循环的适用场景以及优势4. 注意

详解Spring Boot接收参数的19种方式

《详解SpringBoot接收参数的19种方式》SpringBoot提供了多种注解来接收不同类型的参数,本文给大家介绍SpringBoot接收参数的19种方式,感兴趣的朋友跟随小编一起看看吧... 目录SpringBoot接受参数相关@PathVariable注解@RequestHeader注解@Reque

Python中的异步:async 和 await以及操作中的事件循环、回调和异常

《Python中的异步:async和await以及操作中的事件循环、回调和异常》在现代编程中,异步操作在处理I/O密集型任务时,可以显著提高程序的性能和响应速度,Python提供了asyn... 目录引言什么是异步操作?python 中的异步编程基础async 和 await 关键字asyncio 模块理论

好题——hdu2522(小数问题:求1/n的第一个循环节)

好喜欢这题,第一次做小数问题,一开始真心没思路,然后参考了网上的一些资料。 知识点***********************************无限不循环小数即无理数,不能写作两整数之比*****************************(一开始没想到,小学没学好) 此题1/n肯定是一个有限循环小数,了解这些后就能做此题了。 按照除法的机制,用一个函数表示出来就可以了,代码如下

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

poj3750约瑟夫环,循环队列

Description 有N个小孩围成一圈,给他们从1开始依次编号,现指定从第W个开始报数,报到第S个时,该小孩出列,然后从下一个小孩开始报数,仍是报到S个出列,如此重复下去,直到所有的小孩都出列(总人数不足S个时将循环报数),求小孩出列的顺序。 Input 第一行输入小孩的人数N(N<=64) 接下来每行输入一个小孩的名字(人名不超过15个字符) 最后一行输入W,S (W < N),用

校验码:奇偶校验,CRC循环冗余校验,海明校验码

文章目录 奇偶校验码CRC循环冗余校验码海明校验码 奇偶校验码 码距:任何一种编码都由许多码字构成,任意两个码字之间最少变化的二进制位数就称为数据检验码的码距。 奇偶校验码的编码方法是:由若干位有效信息(如一个字节),再加上一个二进制位(校验位)组成校验码。 奇校验:整个校验码中1的个数为奇数 偶校验:整个校验码中1的个数为偶数 奇偶校验,可检测1位(奇数位)的错误,不可纠错。

机器学习之监督学习(三)神经网络

机器学习之监督学习(三)神经网络基础 0. 文章传送1. 深度学习 Deep Learning深度学习的关键特点深度学习VS传统机器学习 2. 生物神经网络 Biological Neural Network3. 神经网络模型基本结构模块一:TensorFlow搭建神经网络 4. 反向传播梯度下降 Back Propagation Gradient Descent模块二:激活函数 activ