快速删掉文件夹里重复或者相似的图片

2023-12-11 17:28

本文主要是介绍快速删掉文件夹里重复或者相似的图片,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

需求:快速删掉文件夹里重复或者相似的图片

一.软件推荐

1.电脑重复资源查找器

免费,简单好操作,在各种图像格式间比较内容,内置高速比较算法,灵活的扫描源:驱动器、文件夹、文件及类型,结果可复用:能保存 / 载入重复图片列表,支持所有常见图片类型(1,000 种以上)。

2.Duplicate Cleaner

Duplicate Cleaner Pro (官网:Duplicate Cleaner - Remove duplicate files)中文版是一款功能非常强大的重复文件查找工具,这个是无需注册、无需安装的单文件绿色便携版!程序可以帮助你快速的查找重复的图片、音乐等各种文件,可以根据字节、MD5、SHA等多种方式来 快速扫描!它可以同时搜索多个文件夹,支持按文件名称、大小和时间进行搜索。

3.DoubleKiller Pro

DoubleKiller Pro是一款小巧易用的多功能电脑重复文件清理软件,可以帮助你以文件名、大小、创建时间或CRC32校验值等特征快速扫描电脑中的所有重复文件,同时还能够支持搜索不同驱动器的指定类型的重复文件,并进行清除,很好解决电脑使用久了之后导致大量重复文件的堆积,占据电脑的大量内存的问题。

二.Github项目(python)实现

找相似图像:

1.FileManager

该项目支持22项功能如下:

  • 导出文件信息
  • 查找重复文件(基于大小和修改时间的判断方式, 以及基于文件 hash 值的判断方式)
  • 文件还原与备份(增量备份、文件同步、 文件还原)
  • 根据样本或者记录删除文件或者还原文件
  • 一键清空目录下所有空 文件夹
  • 搜索文件或者文件夹(可搜索隐藏文件)
  • 拷贝目录结构(导出到文件、 从文件恢复目录结构、导出目录结构到新目录下)
  • 比对文本文件内容(比对文 章、文档、代码的差异并将结果输出,可批量比对)
  • 计算文件 hash 值
  • 校 对字符串(校对两个字符串是否一致,包含忽略大小写,前后空格,以及忽略所 有空格)
  • 提取视频帧图像(可以批量快速提取指定视频的某一帧或者某一秒 的图像)
  • 查找相似图片(根据算法计算图片的相似度,并将满足相似度阈值 的图片移动到指定目录,可以有效找出不同分辨率、不同大小甚至是经过裁剪或 者加过水印的相似图片)
  • 查找相似视频(比对视频帧图像的相似度找出相似 视频并导出)
  • 以图搜图(选中图片在另一任意目录中搜索与之相似的图片)
  • 以视频搜相似视频(选中视频在另一任意目录中搜索与之相似的视频,主要 用于找出内容一样但是分辨率不同,或者内容一样只是水印有差异的视频)
  • 批量重命名
  • 合并视频(将选中的视频合并为一个视频,可以指定视频帧率)
  • 裁剪视频(集合了之前 video_cut 项目的代码)
  • 批量裁剪视频(选中多个 视频批量裁剪,用于去除视频片头片尾特别好用)
  • 提取音频和转换音频格式 (可以从视频中提取音频,也可以进行音频格式转换,可以指定音频帧率格式, 不一定支持所有音频格式)
  • 找出损坏或者不完整的视频(基于 ffmpeg)
  • 获取时间戳(时间与时间戳之间相互转换)以及修改文件的时间戳 所有的文件删除、文件更新操作进行防呆保护,最大限度保证数据安全!所 有操作都有日志,方便追溯和还原。涉及程序配置内容修改的操作会有权限验证


所有操作均可通过GUI界面进行操作,源码分享实属良心。

2.Imagededup

具体使用方法参考:https://github.com/chinalu/imagedups

安装
python setup.py install
使用方法
仅显示重复的图片:imagedups -p /path/to/image/folder1  
[+]开头的文件是保留的文件;
[-]开头的文件是可以清理的文件。
递归查找文件:imagedups -r -p /path/to/image/folder
查找并删除文件:imagedups -r -d -p /path/to/image/folder
删除文件是不进行确认:imagedups -r -d -N -p /path/to/image/folder
请做好数据备份

3.PicSniffer

主要采用Inception-v3模型对图片进行特征提取

文章首发地址: FUNNY AI

这篇关于快速删掉文件夹里重复或者相似的图片的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/481475

相关文章

Python脚本实现自动删除C盘临时文件夹

《Python脚本实现自动删除C盘临时文件夹》在日常使用电脑的过程中,临时文件夹往往会积累大量的无用数据,占用宝贵的磁盘空间,下面我们就来看看Python如何通过脚本实现自动删除C盘临时文件夹吧... 目录一、准备工作二、python脚本编写三、脚本解析四、运行脚本五、案例演示六、注意事项七、总结在日常使用

mac中资源库在哪? macOS资源库文件夹详解

《mac中资源库在哪?macOS资源库文件夹详解》经常使用Mac电脑的用户会发现,找不到Mac电脑的资源库,我们怎么打开资源库并使用呢?下面我们就来看看macOS资源库文件夹详解... 在 MACOS 系统中,「资源库」文件夹是用来存放操作系统和 App 设置的核心位置。虽然平时我们很少直接跟它打交道,但了

C#中图片如何自适应pictureBox大小

《C#中图片如何自适应pictureBox大小》文章描述了如何在C#中实现图片自适应pictureBox大小,并展示修改前后的效果,修改步骤包括两步,作者分享了个人经验,希望对大家有所帮助... 目录C#图片自适应pictureBox大小编程修改步骤总结C#图片自适应pictureBox大小上图中“z轴

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

使用Python将长图片分割为若干张小图片

《使用Python将长图片分割为若干张小图片》这篇文章主要为大家详细介绍了如何使用Python将长图片分割为若干张小图片,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. python需求的任务2. Python代码的实现3. 代码修改的位置4. 运行结果1. Python需求

Python在固定文件夹批量创建固定后缀的文件(方法详解)

《Python在固定文件夹批量创建固定后缀的文件(方法详解)》文章讲述了如何使用Python批量创建后缀为.md的文件夹,生成100个,代码中需要修改的路径、前缀和后缀名,并提供了注意事项和代码示例,... 目录1. python需求的任务2. Python代码的实现3. 代码修改的位置4. 运行结果5.

shell脚本快速检查192.168.1网段ip是否在用的方法

《shell脚本快速检查192.168.1网段ip是否在用的方法》该Shell脚本通过并发ping命令检查192.168.1网段中哪些IP地址正在使用,脚本定义了网络段、超时时间和并行扫描数量,并使用... 目录脚本:检查 192.168.1 网段 IP 是否在用脚本说明使用方法示例输出优化建议总结检查 1

MySQL中删除重复数据SQL的三种写法

《MySQL中删除重复数据SQL的三种写法》:本文主要介绍MySQL中删除重复数据SQL的三种写法,文中通过代码示例讲解的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下... 目录方法一:使用 left join + 子查询删除重复数据(推荐)方法二:创建临时表(需分多步执行,逻辑清晰,但会

Rust中的Option枚举快速入门教程

《Rust中的Option枚举快速入门教程》Rust中的Option枚举用于表示可能不存在的值,提供了多种方法来处理这些值,避免了空指针异常,文章介绍了Option的定义、常见方法、使用场景以及注意事... 目录引言Option介绍Option的常见方法Option使用场景场景一:函数返回可能不存在的值场景

使用 Python 和 LabelMe 实现图片验证码的自动标注功能

《使用Python和LabelMe实现图片验证码的自动标注功能》文章介绍了如何使用Python和LabelMe自动标注图片验证码,主要步骤包括图像预处理、OCR识别和生成标注文件,通过结合Pa... 目录使用 python 和 LabelMe 实现图片验证码的自动标注环境准备必备工具安装依赖实现自动标注核心