tf.train.ExponentialMovingAverage用法和说明

本文主要是介绍tf.train.ExponentialMovingAverage用法和说明，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

在这篇博客中对tf.train.ExponentialMovingAverage讲的很清楚，这里主要补充几点说明：
第一点：

当程序执行到 ema_op = ema.apply([w]) 的时候，如果 w 是 Variable，那么将会用 w 的初始值初始化 ema 中关于 w 的 ema_value，所以 emaVal0=1.0。如果 w 是 Tensor的话，将会用 0.0 初始化。

这段话的意思是：因为w初始化为1.0, 对它进行衰减操作，因为在下面循环三次，每次update后，w的实际值分别为2.0,3.0,4.0。
而由于衰减公式为：shadowVariable=decay∗shadowVariable+(1−decay)∗variable，
在第一次衰减w的时候，shadowVariable并不存在，所以shadowVariable取的值为w的初始值，因为w = tf.Variable(1.0)，所以w的初始值为1.0,所以ema_val第一次输出的值为0.9*1+0.1*2=1.1。
第二点：
如果对tf.identity和tf.control_dependencies有疑问的话可以参考我上篇博客：tf.identity 和 tf.control_dependencies的用法。

此外具体例子还可以参考这篇博客，对参数进行了详解。
其中参数trainable=False，代表在训练中这个变量不会被改变，可以通过手动对它改变。
decay=min{decay,(1+num_updates)/(10+num_updates)}
另外当设置了num_updates，则decay会进行上式的运算，其中min函数的第二项会随着num_updates增大而增大，所以当其大到一定程度，decay就始终是初始值（假如是初始值为0.99），这样就不会随着num_updates增大，导致其接近1而使变量不在衰减。

还可以再看一下：https://www.cnblogs.com/cloud-ken/p/7521609.html
对函数作用都有讲解。

这篇关于tf.train.ExponentialMovingAverage用法和说明的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

tf.train.ExponentialMovingAverage用法和说明

相关文章

全面掌握 SQL 中的 DATEDIFF函数及用法最佳实践

MySQL中的LENGTH()函数用法详解与实例分析

zookeeper端口说明及介绍

Java中的数组与集合基本用法详解

Go语言中make和new的区别及说明

MySQL 中的 CAST 函数详解及常见用法

Python中你不知道的gzip高级用法分享

java中新生代和老生代的关系说明

解读GC日志中的各项指标用法

MySQL数据库中ENUM的用法是什么详解