人工智能小白日记 人脸检测识别之4 移植facenet到安卓平台

本文主要是介绍人工智能小白日记 人脸检测识别之4 移植facenet到安卓平台,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 正文
    • 1-1 使用tflite如何移植
    • 1-2 转换格式
    • 1-3 安卓运行环境配置
    • 2 使用pb
  • 小结

前言

因为业务需要最近开始做tensorflow的移植工作了,一通下来发现有坑无数,萌新表示只能顺着大佬们的步伐前进。

正文

1-1 使用tflite如何移植

tensorflow官方提供了对移动端的支持。tf lite
https://tensorflow.google.cn/lite/guide
在这里插入图片描述
由两个模块组成:
tflite解释器和tflite转换器。

通过转换器将我们的模型转换为tflite支持的指定格式,再由解释器在各端运行即可。

1-2 转换格式

在这里插入图片描述
这里告诉我们格式转换的好处,和一些注意事项:可以优化模型大小,利用一些折衷的办法对移动端的执行进行优化。 当然,不是所有模型可以被转换,这个我们后面再看

在这里插入图片描述
这里提供了转换器的使用方式,正好是用python的api。
总共三个步骤:获取模型,转换,最后保存为tflite格式。

问题收集:
1)module ‘tensorflow’ has no attribute ‘lite’
我的tf版本是1.11,去官网查下api
在这里插入图片描述
发现是1.14版本,于是用conda搭建个1.14版的环境出来,运行,果然有第二个错误

2)SavedModel file does not exist at : xxx/{saved_model.pbtxt|saved_model.pb}
这个肯定跟输入的格式有关,再查一下,其支持以下几种输入模型
在这里插入图片描述
目前还不知道这些不同的模型有啥区别,不过我提供了模型路径,后提示没有pbtxt或者pb格式的文件。这个pb文件很眼熟,facenet预训练模型中会有,不过我的再训练模型中没有。

经过一阵实验过程, 最终在这里找到的解决方案,成功生成了.tflite文件
https://xbuba.com/questions/53596521

1-3 安卓运行环境配置

继续参考官方文档
https://tensorflow.google.cn/lite/guide/android
1)添加对tensorflow-lite的依赖,顺便加上gpu依赖

dependencies {implementation 'org.tensorflow:tensorflow-lite:0.0.0-nightly'implementation 'org.tensorflow:tensorflow-lite-gpu:0.0.0-nightly'
}

2)对ndk进行配置

android {defaultConfig {ndk {abiFilters 'armeabi-v7a', 'arm64-v8a'}}//set no compress modelsaaptOptions {noCompress "tflite"}
}

貌似其他的没找着,参考下别人写的
https://blog.csdn.net/qq_33200967/article/details/82773677

3)在main目录下创建assets文件夹,这个文件夹主要是存放tflite模型和label名称文件。把刚才转好的.tflite文件丢进来

4)编写调用代码

在java中进行调用

try (Interpreter interpreter = new Interpreter(tensorflow_lite_model_file)) {interpreter.run(input, output);
}
//gpu版
GpuDelegate delegate = new GpuDelegate();
Interpreter.Options options = (new Interpreter.Options()).addDelegate(delegate);
Interpreter interpreter = new Interpreter(tensorflow_lite_model_file, options);
try {interpreter.run(input, output);
}

问题收集:
1)如果碰到安卓bitmap读取为空,八成是权限问题,7.0系统以上需要动态获取权限
2)如果碰到assets读取不到模型时,八成是模型被压缩了,也就是配置的时候是不是忘了将noCompress那段放进去了。
3)java.lang.IllegalArgumentException: Cannot convert between a TensorFlowLite tensor with type UINT8 and a Java object of type [F (which is compatible with the TensorFlowLite type FLOAT32).

这个问题是因为在做tflite_convert的时候,我们将inference_type和inference_input_type设置为QUANTIZED_UNIT8, 为了顺利的跑起来,先把inference_type和inference_input_type改回FLOAT。至于返回是(1,512)的张量这种小问题相信都可以解决了。

2 使用pb

facenet源代码中自带了src/freeze_grapy.py ,可以使用它来生成pb文件,如果在安卓中调用的时候发生如下问题:
Not a valid TensorFlow Graph serialization: NodeDef mentions attr ‘explicit_paddings’ not in…
解决方案是,你的python版tensorflow版本号,必须和安卓中使用的一致

在左侧Project模式下External Libraries中查询安卓中的版本
在这里插入图片描述

小结

最终是跑出来了,效果咋样等待测试,不过一下子没办法测试,以后补回测试结果。这还只是个facenet,还有mtcnn也需要移植。还有inference_type和inference_input_type设置为QUANTIZED_UNIT8可以对模型进行压缩,但是后面该怎么对上类型呢? 太多问题。时间太紧,后面再慢慢填坑。

这篇关于人工智能小白日记 人脸检测识别之4 移植facenet到安卓平台的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/689721

相关文章

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推