tensorflow中tf.nn.embedding

tensorflow中tf.nn.embedding_lookup的用法

本文主要是介绍tensorflow中tf.nn.embedding_lookup的用法，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

转自：STHSF

embedding_lookup( )的用法
关于tensorflow中embedding_lookup( )的用法，在Udacity的word2vec会涉及到，本文将通俗的进行解释。

首先看一段网上的简单代码：

#!/usr/bin/env/python
# coding=utf-8
import tensorflow as tf
import numpy as npinput_ids = tf.placeholder(dtype=tf.int32, shape=[None])embedding = tf.Variable(np.identity(5, dtype=np.int32))
input_embedding = tf.nn.embedding_lookup(embedding, input_ids)sess = tf.InteractiveSession()
sess.run(tf.global_variables_initializer())
print(embedding.eval())
print(sess.run(input_embedding, feed_dict={input_ids:[1, 2, 3, 0, 3, 2, 1]}))1
2
3
4
5
6
7
8
9
10
11
12
13
14

代码中先使用palceholder定义了一个未知变量input_ids用于存储索引，和一个已知变量embedding，是一个5*5的对角矩阵。
运行结果为：

embedding = [[1 0 0 0 0][0 1 0 0 0][0 0 1 0 0][0 0 0 1 0][0 0 0 0 1]]
input_embedding = [[0 1 0 0 0][0 0 1 0 0][0 0 0 1 0][1 0 0 0 0][0 0 0 1 0][0 0 1 0 0][0 1 0 0 0]]1
2
3
4
5
6
7
8
9
10
11
12

简单的讲就是根据input_ids中的id，寻找embedding中的对应元素。比如，input_ids=[1,3,5]，则找出embedding中下标为1,3,5的向量组成一个矩阵返回。

如果将input_ids改写成下面的格式：

input_embedding = tf.nn.embedding_lookup(embedding, input_ids)
print(sess.run(input_embedding, feed_dict={input_ids:[[1, 2], [2, 1], [3, 3]]}))1
2

输出结果就会变成如下的格式：

[[[0 1 0 0 0][0 0 1 0 0]][[0 0 1 0 0][0 1 0 0 0]][[0 0 0 1 0][0 0 0 1 0]]]1
2
3
4
5
6

对比上下两个结果不难发现，相当于在np.array中直接采用下标数组获取数据。需要注意的细节是返回的tensor的dtype和传入的被查询的tensor的dtype保持一致；和ids的dtype无关。

这篇关于tensorflow中tf.nn.embedding_lookup的用法的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

tensorflow中tf.nn.embedding_lookup的用法

相关文章

MySQL中between and的基本用法、范围查询示例详解

Java序列化之serialVersionUID的用法解读

python3中正则表达式处理函数用法总结

MySQL 中的 JSON_CONTAIN用法示例详解

JDK21对虚拟线程的几种用法实践指南

Java8 Collectors.toMap() 的两种用法

Python中isinstance()函数原理解释及详细用法示例

Python中的sort方法、sorted函数与lambda表达式及用法详解

vue监听属性watch的用法及使用场景详解

Java Instrumentation从概念到基本用法详解