本文主要是介绍TensorFlow on Android(6): 看起来像个机器学习专家,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
回顾
先来回顾一下我们为了实现一个物体识别器都做了哪些工作:
- 找到Pre-traind Model
- 找到TensorFlow的Android库
- 找到相应的Input Op
- 向Input Op 输入相应格式的数据
- 找到相应的Output Op
- 从Output Op中提取数据并解析
是不是有一种很熟悉的感觉, 这个像极了我们使用一个Jar包或者一个Ruby Gem:先下载相应的库, 然后再看文档知道API的输入参数是什么, 返回结果什么, 然后再调用它。 这个类比的确很像, 不幸的是, 大部分的模型,或者说大部分TensorFlow Models项目里面的模型,并没有这么详细的,标准的文档,有的还需要你自己去导出.pb文件。 如果你不满足于只实现一个物体识别器, 还想用一些其他的模型来解决你的问题, 那么可能你需要自己去找到Inupt/Output Op, 输入参数的格式等。 我们这里仍然以Object Detection API为例子,来看一下可以从哪些地方获取这样的信息。
准备工作##
在开始之前,我们需要安装一些工具, 这些工具也是机器学习专家经常使用的。(COOL! 我们首先学会了一些机器学习的术语, 现在又开始学习使用机器学习的工具了, 下次化妆舞会上你就可以扮演机器学习专家了,没人认得出来!)
Python: 说到机器学习, Python肯定是必不可少的,我也建议大家, 如果不会的话可以先开始学习,在后面的文章中我们会用到的。
在这里可以找到详细的文档,教你在各个平台上面安装Python。
Jupyter Notebook: 这是一个交互式的文档, 可以将文本, 公式, 代码和一些可视化的内容集合到一个文档里面,在机器学习和数据处理的领域里面,你会经常用到它, 安装很简单:
pip install --upgrade pip
pip install jupyter
TensorFlow: 最终我们还是需要安装这个框架,因为我们可能需要写一点Python代码, 在后面的文章中,我们也需要用到。 可以在这里找到相关文档
安装完这3个东西以后,我们就可以正式开始了。
从代码中寻找
代码永远是最好的文档。 TensorFlow Models项目中大部分的模型都有展示如何Inference的Python代码, 读懂这些代码能获取到大量关于如何使用这个模型的信息, 之后你就可以进行其他语言的移植了。
Object Detection API提供了一个Jupyter Notebook的文档, 我们来看一下。
首先你要下载TensorFlow Models的代码
git clone https://github.com/tensorflow/models.git
然后运行Jupyter Notebook
cd models/research/object_detection
jupyter notebook
如果不发生意外的话,命令行终端上应该会打出启动成功的信息, 默认情况下会在localhost:8888上启用一个web服务,并自动打开你的浏览器跳转到相应的页面:
我们点击object_detection_tutorial_ipynb文件,就可以打开这个notebook了
在上面我们可以看到使用这个模型的Python示例代码:
如果你对Python足够熟悉的话, 可以从这些代码里面获取到相应的信息,然后可以根据这些信息再移植到其他语言。
注意这里python代码和我们的Android代码稍微有点不一样,比如
image_tensor = detection_graph.get_tensor_by_name('image_tensor:0')
Python接口里面是通过获取Op的output tensor, 然后在tensor上面操作进行数据的输入和输出,所以这里用’image_tensor:0’ 代表 ‘image_tensor’ Op的第一个output tensor, 这里Java和Python接口的形式不一样, 但是逻辑是一致的。
用TensorBoard来检视模型
TensorBoard是TensorFlow自带的一个可视化工具
如果说从代码里面获取的信息还不够的话, 我们还可以用TensorBoard来直接查看模型的结构,或者用TensorFlow的术语来说,模型的Graph
TensorBoard运行的时候会在本地启动一个Web服务器,然后将相关的数据显示在网页上,我们可以把.pb文件导入到TensorBoard里面,然后显示整个网络的结构。
也许在一个完美的世界里面,我们可以选择文件->打开->选择.pb文件,就可以看到结果了,但是在这个残酷的现实世界里,我们还需要写一点Python代码才能做到这点(已经有人在TensorFlow的项目里面提了这个Feature request, 不过就本博客编写的时候,这个功能还没有实现)
现在找到我们的.pb文件, 然后在同一目录里面创建一个load_graph.py文件, 内容为:
import tensorflow as tf
from tensorflow.python.platform import gfile
with tf.Session() as sess:model_filename ='FILENAME_OF_PB_FILE'with gfile.FastGFile(model_filename, 'rb') as f:graph_def = tf.GraphDef()graph_def.ParseFromString(f.read())g_in = tf.import_graph_def(graph_def)
LOGDIR='log'
train_writer = tf.summary.FileWriter(LOGDIR)
train_writer.add_graph(sess.graph)%
注意你需要将FILENAME_OF_PB_FILE替换为.pb文件的文件名,比如model.pb
然后运行
python load_graph.py
如果没有出现意外的话, 运行这段Python代码之后,会在log文件夹里面生成TensorBoard需要的文件,现在整个目录看起来是这样的
然后我们CD到这个目录, 运行
tensorboard --logdir ./log
然后打开
http://localhost:6006/#graphs
然后双击"import", 整个网络的结构就出来了
在这个图上我们不难找到Input和output Op
我们再观察连接这些Op的箭头上的内容,比如image_tensor上面写着 1x?x?x3, 这代表着这个输入/输出的数据的shape。在这里image_tensor输出给下一个节点的数组Shape为 (1, image_height, image_width, 3)
数组Shape的定义,你可以参考NumPy的相关文档,我们这里不做深入的讨论。 你只需要知道,这个shape和我们在java接口里面调用Feed接口的参数是一致的:
inferenceInterface.feed("image_tensor", byteInput, 1, 300, 300, 3);
一般来说,结合示例代码和网络结构图,如何使用一个模型就应该很清楚了。
一些资源##
- Caffe Model Zoo
- Keras Model Zoo
- Run TensorFlow in your browser
- Run Keras in your browser
这篇关于TensorFlow on Android(6): 看起来像个机器学习专家的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!