举例说明tf中LSTMCell的cell、num_unit是什么意思

2023-10-29 12:40

本文主要是介绍举例说明tf中LSTMCell的cell、num_unit是什么意思,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 1. 对于cell的解释
    • 2. 对num_units参数的解释
    • 3. LSTM的每个cell参数共享

1. 对于cell的解释

在这里插入图片描述
LSTM一般都会一连串的小团团,这一个个小团团就表示一个cell。如上图所示。

2. 对num_units参数的解释

在这里插入图片描述
上图中,我们很多步计算中都有用到W, 其实num_units就表示线性层的隐藏节点个数,也即输出的维度。
例如:
num_units = 128, 就表示我们输出的维度是[128, 1](也有可能是[1, 128],看具体需要,两者只差一个转置,没有太大的本质区别)。
我们的输入xt的维度为[28, 1], 那么 [ h t − 1 , x t ] = [ 128 + 28 , 1 ] = [ 156 , 1 ] [h_{t-1},x_t]=[128+28, 1]=[156,1] [ht1,xt]=[128+28,1]=[156,1],所以我们的W的维度为[128, 156]

总之,参数num_units = 128,就表示每一个cell的输出维度为[128, 1] 或 [1, 128]

3. LSTM的每个cell参数共享

下图非常明白的展示了LSTM其实也只有一个cell,权重也共享
在这里插入图片描述

这篇关于举例说明tf中LSTMCell的cell、num_unit是什么意思的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/300735

相关文章

Maven创建项目中的groupId, artifactId, 和 version的意思

文章目录 groupIdartifactIdversionname groupId 定义:groupId 是 Maven 项目坐标的第一个部分,它通常表示项目的组织或公司的域名反转写法。例如,如果你为公司 example.com 开发软件,groupId 可能是 com.example。作用:groupId 被用来组织和分组相关的 Maven artifacts,这样可以避免

cell phone teardown 手机拆卸

tweezer 镊子 screwdriver 螺丝刀 opening tool 开口工具 repair 修理 battery 电池 rear panel 后盖 front and rear cameras 前后摄像头 volume button board 音量键线路板 headphone jack 耳机孔 a cracked screen 破裂屏 otherwise non-functiona

? extends T 和 ? super T分别是什么意思?有什么不同?

<? extends T>首先你很容易误解它为继承于T的所有类的集合,这是大错特错的,相信能看下去你一定见过或用过List<? extends T>吧?为什么我说理解成一个集合是错呢?如果理解成一个集合那为什么不用List<T>来表示?所以<? extends T>不是一个集合,而是T的某一种子类的意思,记住是一种,单一的一种,问题来了,由于连哪一种都不确定,带来了不确定性,所以是不可能通过add

路由器的Loopback地址是什么意思?

本地环回接口(或地址),亦称回送地址(loopback address)。 此类接口是应用最为广泛的一种虚接口,几乎在每台路由器上都会使用。常见于如下用途: 1 作为一台路由器的管理地址  系统管理员完成网络规划之后,为了方便管理,会为每一台路由器创建一个loopback 接口,并在该接口上单独指定一个IP 地址作为管理地址,管理员会使用该地址对路由器远程登录(telnet )

【深度学习 走进tensorflow2.0】TensorFlow 2.0 常用模块tf.config

无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。人工智能教程 本篇文章将会教大家如何 合理分配显卡资源,设置显存使用策略。主要使用tf.config模块进行设置。下面我们一起了解下具体用法和例子。 一、指定当前程序使用的 GPU 例如,在一台具有 4 块 GPU 和一个 C

【0323】Postgres内核之 hash table sequentially search(seq_scan_tables、num_seq_scans)

0. seq scan tracking 我们在这里跟踪活跃的 hash_seq_search() 扫描。 需要这种机制是因为如果扫描正在进行时发生桶分裂(bucket split),它可能会访问两次相同的条目,甚至完全错过某些条目(如果它正在访问同一个分裂的桶中的条目)。因此,如果正在向表中插入数据,我们希望抑制桶分裂。 在当前的使用中,这种情况非常罕见,因此只需将分裂推迟到下一次插入即可。

猫猫学iOS 之微博项目实战(10)微博cell中图片的显示以及各种填充模式简介

猫猫分享,必须精品 原创文章,欢迎转载。转载请注明:翟乃玉的博客 地址:http://blog.csdn.net/u013357243 :一效果 如果直接设置会有拉伸等等的状况,这里主要介绍图片显示的一些细节 二:代码 代码实现其实很简单,微博当中用了一个photos来存放九宫格这些图片,然后用了一个photo类来做每个photo,并且在上面显示gif等的样式,很多很多小技巧,直接

【Get深一度】小波分析概念3——正则性是什么意思,通俗解释

正则性英文是regularity,正则性一般用来刻画函数的光滑程度,正则性越高,函数的光滑性越好。通常用Lipschitz指数k来表征函数的正则性。 度量函数的正则性时,消失矩的概念是重要的,若消失矩的阶数小于正则性指数,这是小波度量不出该

【Get深一度】小波分析概念2——消失矩阶数是什么意思,通俗解释

实际应用中,基本小波不仅要满足容许条件,还要施加所谓的消失矩(Vanishing Moments)条件原因:使 尽量多的小波系数为 零 或者产生 尽量少 的非零小波系数目的:有利于数据压缩和消除噪声。 小波的消失矩的定义:若

【Get深一度】小波分析概念1——紧支撑集是什么意思,通俗解释

最近学到小波,在仿真中也用到了紧支撑函数;紧支撑性越好,说明能量越集中;用最通俗的话来讲,紧支撑是这样的: 对于函数f(x),如果自变量x在 0附近的取值范围内,f(x)能取到 C;