是时候展示一波花里胡哨了——以图搜图

2023-10-09 00:10

本文主要是介绍是时候展示一波花里胡哨了——以图搜图,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

导读

前段时间分享一个小视频,今天来详细讲解一波如何实现以图搜图,这篇写了好几天,自身能力有限可能没办法写的非常完美,也没有办法把所有点都讲的非常的仔细,但是我都会附上详细的链接,大家有什么不懂的都可以去查一哈,我觉得这个项目还是挺有趣的,最后我还附上了一个视频操作,第一次录视频意外多多,不足之处请大家见谅,如果尝试过后觉得不错的可以帮忙点一波“在看”或者分享朋友圈和群,小编会万分感谢的!!!

全文共 3600 字,16幅图表截屏
预计阅读时间 9分钟。

一、什么是以图搜图

广义上,图像搜索的分类可以分为两种,

(1)基于上下文本的图片搜索

        例如:百度,在搜索框中输入“搜索文字”,点击“图片搜索”,即可获得图片搜索结果;

(2)基于图片内容的搜索

       基于图片中特征进行搜索

详细内容可以查看:

《当SIFT邂逅CNN:图像检索任务跨越十年的探索历程》https://www.jianshu.com/p/80159860d4e0

图像搜索在现在应用的非常普遍,是一个非常有趣和实用的工具。相对于关键字搜索,以图搜图的方式更加的方便,特别对于特征难以用文字描述的,这个时候图像搜索就能展示出它的强大了。

当然还有很多应用场景:

你需要的图片有水印,想要找到无水印的版本。

二、常见的以图搜图的网站

百度识图:https://www.baidu.com/

拍立淘:http://www.pailitao.com/

360图片:http://image.so.com/

更多的可以查考:https://www.runningcheese.com/cbir

例如百度的以图搜图步骤如下:

(1)打开百度(www.baidu.com)

640?wx_fmt=png

(2)基于文本的图片搜索:

640?wx_fmt=png

(3)基于图片内容的图片搜索:

    1、点击“相机”图标

640?wx_fmt=png

    2、拖拽图片

640?wx_fmt=jpeg

    3、自动显示结果

640?wx_fmt=png

三、基于内容的图像搜索原理

这里以淘宝的产品拍立淘为例,

拍立淘的原理:

640?wx_fmt=png

参考:https://www.sohu.com/a/164506831_468650

实际上,拍立淘图像搜索的过程分为两步,

第一步:识别物品种类

第二部:相似度匹配

-------------------------------------------

(1)识别物品种类(目标检测):当你拿起手机拍照的时候,手机淘宝会对图片中的所有物品进行识别,然后提示让你选择你所需要的找的相似物品类别是什么,这个过程实际上就是一个目标检测(如下图所示);

640?wx_fmt=png

对于上面的图中,含有衣服以及书包,此时软件会让你根据需求进行选择相应的类别,在对应类别的库中搜索相似的商品并输出结果;

(2)相似度匹配:第一步的目的找到对应的类别,而找到了对应的类别还不能满足我们的需求,比如找到了书包,但实际上书包的款式多种多样,还是无法满足我们的需求,对于上图中,如果我们用语言去描述这个书包,很难准确的描述并找到目标商品,这时就体现了以图搜图的价值了,通过对目标商品进行特征提取并在图片库中进行对比,找到最相似的结果并输出。

由于淘宝的应用场景复杂,种类繁多,而这里我们只想演示一下而已,所以做了一个简单的展示,截取重点的部分进行代码演示:

原理:

640?wx_fmt=png

具体步骤:

(1)图片获取——通过关键字,爬取百度上面的图片

(2)对获取的图片提取特征,建立特征索引库

(3)对测试图片进行特征提取,并在索引库中比较,按相似度排序并输出

四、代码实现

所采用的工具python3.6,keras2.2.4

1)图片获取——通过关键字,爬取百度上面的图片

这里不详细说明爬取百度图片的原理和细节,因为我毕竟不是非常懂,重点讲解一下如何使用,具体的原理和代码可以查看下面的链接https://blog.csdn.net/qq_40774175/article/details/81273198

详细操作:

1、新建一个名字为name.txt的文档,并输入需要的关键字(支持多个关键自)

640?wx_fmt=png

备注:我在name.txt中输入 dasima(换行) wuwukai

这里关键词不要用中文的,不然会对后面的操作会报错

2、运行代码pachong.py,输入每个对应关键字所需要下载的图片数量

640?wx_fmt=png

此时程序会从网上爬取到图片并保存到对应的文件夹中(以关键词命名的文件夹),获取完毕后新建一个文件夹img,当做图片库的存储,并将爬取的图片都放进去;

640?wx_fmt=png

-----------------------获取图片完毕-----------------------

(2)对获取的图片提取特征,建立特征索引库

这里参考《python计算机视觉》的作者之一,袁勇github上面的代码

https://github.com/willard-yuan/flask-keras-cnn-image-retrieval

640?wx_fmt=png

主要的代码为三个,其中index.py用于提取图片的特征和建立索引,query_online.py用于库内搜索

其基本原理是利用VGG16的预训练模型提取图片库的特征(extract_cnn_vgg16_keras.py),同时会将最终输出的特征向量进行归一化,并建立一个索引库

使用方法:

# 建立索引库	
# python3 index.py -database <path-to-dataset> -index <name-for-output-index>index.py -database <path-to-dataset> -index <name-for-output-index>	
# 对database文件夹内图片进行特征提取,建立索引文件featureCNN.h5	
python3 index.py -database database -index featureCNN.h5

(3)对测试图片进行特征提取,并在索引库中比较,按相似度排序并输出

这里采用的相似度实际上是利用测试图片的特征向量(VGG16提取)归一化后与索引库相乘,就是由于特征向量都进行了归一化,当测试图片的特征向量如果与索引库中的某一列的乘积等于1,即说明他们是完全相同的。

其他情况,结果由向量积计算结果可知其相似度的值。

640?wx_fmt=png

# 在线测试	
# python query_online.py -query <path-to-query-image> -index <path-to-index-flie> -result <path-to-images-for-retrieval>	
# 使用database文件夹内001_accordion_image_0001.jpg作为测试图片,在database内以featureCNN.h5进行近似图片查找,并显示最近似的3张图片	
python3 query_online.py -query database/001_accordion_image_0001.jpg -index featureCNN.h5 -result database

注意:这里有个地方可能会报错,当然作者也给出了解决方案

640?wx_fmt=png

这里,我斗胆进行了一点点的修改,

(1)增加了一个异常处理操作,主要是为了方便,即使手误输错也能继续运行,这个在之前的文章中有讲解过;

(2)作者最终显示的结果只能一张一张的展示,没有对比图,因此我稍微修改了一下,让可视化的效果更加的美观一些,有兴趣的可以参考我的代码;

(3)我对参数输入也进行了修改,将模型名字和图片库的路径都固定了,这样子测试的时候比较方便,大家在使用的时候请注意下,如果修改了名字要对应起来。

640?wx_fmt=png

#操作汇总	
# (1)打开终端执行index.py代码	
python3 index.py -database img -index lol.h5	
# 此时已经将图片库转成索引库并保存和输出lol.h5模型	
# (2)继续运行代码 query_online.py	
python3 query_online.py	
# 按照提示,如果要退出输入 exit 查询直接enter	
# 输入测试图片 名字即可(如果测试图片额代码不在同一路径下需要增加路径——这里 设置EI相对路径)

代码:https://github.com/DWCTOD/flask-keras-cnn-image-retrieval-master

可以的话,也可以点一下下star,感谢

五、演示操作和效果

640?wx_fmt=gif

640?wx_fmt=gif

640?wx_fmt=gif

这篇关于是时候展示一波花里胡哨了——以图搜图的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/168912

相关文章

起点中文网防止网页调试的代码展示

起点中文网对爬虫非常敏感。如图,想在页面启用调试后会显示“已在调试程序中暂停”。 选择停用断点并继续运行后会造成cpu占用率升高电脑卡顿。 经简单分析网站使用了js代码用于防止调试并在强制继续运行后造成电脑卡顿,代码如下: function A(A, B) {if (null != B && "undefined" != typeof Symbol && B[Symbol.hasInstan

通过Ajax请求后台数据,返回JSONArray(JsonObject),页面(Jquery)以table的形式展示

点击“会商人员情况表”,弹出层,显示一个表格,如下图: 利用Ajax和Jquery和JSONArray和JsonObject来实现: 代码如下: 在hspersons.html中: <!DOCTYPE html><html><head><meta charset="UTF-8"><title>会商人员情况表</title><script type="text/javasc

Jasperreports+jaspersoft studio 实现单个或多个jrxml(jasper)文件生成一个pdf文件,并利用Servlet发送该pdf文件到浏览器中展示

Jasperreports+jaspersoft studio 实现单个或多个jrxml(jasper)文件生成一个pdf文件,并利用Servlet发送该pdf文件到浏览器中展示; 代码如下: Demo07.jrxml <?xml version="1.0" encoding="UTF-8"?><!-- Created with Jaspersoft Studio version 6.6.

【CSS】flex布局 - 左边超过打点, 右边完整展示

场景:宽度一定的情况下右边自适应,左边被挤压。 需要的效果如下: flex 的三个参数分别对应:flex-grow、flex-shrink、flex-basis。 flex-grow:定义项目的放大比例,默认为0。即如果存在剩余空间,也不放大。flex-shrink:定义项目的缩小比例,默认为1。即如果空间不足,该项目将缩小。flex-basis:定义在分配多余空间之前,项目占据的主轴空间。

C# 无法删除 Winform的PictureBox正在展示的图片

最近用C#的前端项目,写了PictureBox展示并上传图片。想删除掉已经展示和上传的图片,提示资源正在使用中不能删除。 查了一些原因,总结原因是PictureBox控件占用着图片资源,不允许删除。 从PictureBox展示图片入手,可以采用以下两个解决办法: 1:使用Bitmap类转接图片资源 Image bmp = new Bitmap(img); this.twoPictureBo

各种算法动画展示,效果不错。

各种算法动画展示: http://www.yxqzzx.cn/teacher/ShowArticle.asp?ArticleID=417

QT4.8 不展示JPG图片问题解决办法

最近遇到一个很奇怪的问题,项目在自己机上展示JPG图片都是正常的,打包给客户机上始终不展示,试过很多方法,比如本机Debug下不管是运行工程文件还是直接运行 .exe文件 都是可以展示JPG图片的 ,而Release下 发现运行工程文件时 JPG文件也是可以展示的 但是直接运行 Release下exe文件 是不展示JPG文件的。最终经过大神的提示和网上的搜索 知道是由于缺少jpg插件 , 也就是

ELK系列之四---如何通过Filebeat和Logstash优化K8S集群的日志收集和展示

前 言 上一篇文章《日志不再乱: 如何使用Logstash进行高效日志收集与存储》介绍了使用ELK收集通用应用的日志,在目前大多应用都已运行在K8S集群上的环境,需要考虑怎么收集K8S上的日志,本篇就介绍一下如何使用现有的ELK平台收集K8S集群上POD的日志。 K8S日志文件说明 一般情况下,容器中的日志在输出到标准输出(stdout)时,会以.log的命名方式保存在/var/log/po

Cesium 展示——实现昼夜交替

文章目录 需求分析1. 添加2. 移除 需求 Cesium 展示——实现昼夜交替 分析 1. 添加 <

前端百科---标签信息展示

在Web开发工程中,会遇到将后台返回的json数据进行页面展示,而很多的开发者都喜欢使用类似标签的样式进行信息展示.本文就简单了展示两种信息的展示样式,直接上demo:        在类选择器.bean中,display: inline-block的作用是将div属性变为行内元素(不占一行,宽度由内容决定).当然也可以使用float来实现(记得清除浮动奥). 注