更换数据集导致错误OSError: Unrecognized data stream contents when reading image file

本文主要是介绍更换数据集导致错误OSError: Unrecognized data stream contents when reading image file,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 查找错误
  • 打印错误文件并查看其二进制开头
  • 移动文件
  • 补充,将后缀是png但实际是jpg图像转换为png图像

查找错误

比如我的png格式图片要一样的开头时

def is_valid_image(path):try:bValid = Truefileobj = open(path, 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\x89PNG'):  # 是否以\x89PNG开头 表示PNGbValid = Falseprint(buf)else:try:Image.open(fileobj).verify()except Exception as e:bValid = Falseexcept Exception as e:return Falsereturn bValid

jpg格式

def is_valid_image(path):try:bValid = Truefileobj = open(path, 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\xff\xd8'):  # 是否以\xff\xd8开头 表示JPEG(jpg)bValid = Falseelse:try:Image.open(fileobj).verify()except Exception as e:bValid = Falseexcept Exception as e:return Falsereturn bValid

打印错误文件并查看其二进制开头

以png为例,如果不想看二进制开头可注释掉print(buf)

import os
from PIL import Image
import shutildef is_valid_image(path):try:bValid = Truefileobj = open(path, 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\x89PNG'):  # 是否以\x89PNG开头 表示PNGbValid = Falseprint(buf)else:try:Image.open(fileobj).verify()except Exception as e:bValid = Falseexcept Exception as e:return Falsereturn bValiddef is_call_valid(path, move_to_path):# 遍历图像夹下所有图像 root:根目录  dirs:根目录下所有目录(文件夹):files: 包含所有图像的一个listfor root, dirs, files in os.walk(path):for img_file in files:# 组合图像的绝对路径img_file_path = os.path.join(root, img_file)# 调用图像判断函数flag = is_valid_image(img_file_path)# 判断图像是否损坏,若是则移动到失效文件路径中if flag == False:# this delete can not restore# os.remove(img_file_path)print(img_file_path)# 移动文件# shutil.move(img_file_path, move_to_path)# print(img_file_path)# is_call_valid('./dataset/train_data/ors-4199/gt','./fail ors-4199')
is_call_valid('./dataset/train_data/RSISOD/gt','./fail RSISOD')

移动文件

import os
from PIL import Image
import shutildef is_valid_image(path):try:bValid = Truefileobj = open(path, 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\x89PNG'):  # 是否以\x89PNG开头 表示PNGbValid = Falseelse:try:Image.open(fileobj).verify()except Exception as e:bValid = Falseexcept Exception as e:return Falsereturn bValiddef is_call_valid(path, move_to_path):# 遍历图像夹下所有图像 root:根目录  dirs:根目录下所有目录(文件夹):files: 包含所有图像的一个listfor root, dirs, files in os.walk(path):for img_file in files:# 组合图像的绝对路径img_file_path = os.path.join(root, img_file)# 调用图像判断函数flag = is_valid_image(img_file_path)# 判断图像是否损坏,若是则移动到失效文件路径中if flag == False:# this delete can not restore# os.remove(img_file_path)# 移动文件shutil.move(img_file_path, move_to_path)# print(img_file_path)is_call_valid('./dataset/train_data/ors-4199/gt','./fail ors-4199')
is_call_valid('./dataset/train_data/RSISOD/gt','./fail RSISOD')

补充,将后缀是png但实际是jpg图像转换为png图像

from PIL import Image
import os# 设置输入文件夹路径和目标格式
input_folder = './dataset/train_data/RSISOD/gt/pool'
target_format = 'png'# 循环遍历输入文件夹中的所有文件
for filename in os.listdir(input_folder):# 检查文件是否为jpg格式fileobj = open(os.path.join(input_folder, filename), 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\x89PNG'):# 组合新的文件名和路径img_path_jpg = os.path.join(input_folder, filename)img_path_png = os.path.splitext(img_path_jpg)[0] +'!'+ '.' + target_format# 读取JPG格式图片并保存为PNG格式with Image.open(img_path_jpg) as img:img.save(img_path_png)# 删除原始JPG格式图片os.remove(img_path_jpg)

这篇关于更换数据集导致错误OSError: Unrecognized data stream contents when reading image file的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/305791

相关文章

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

mysql中的数据目录用法及说明

《mysql中的数据目录用法及说明》:本文主要介绍mysql中的数据目录用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、版本3、数据目录4、总结1、背景安装mysql之后,在安装目录下会有一个data目录,我们创建的数据库、创建的表、插入的

Navicat数据表的数据添加,删除及使用sql完成数据的添加过程

《Navicat数据表的数据添加,删除及使用sql完成数据的添加过程》:本文主要介绍Navicat数据表的数据添加,删除及使用sql完成数据的添加过程,具有很好的参考价值,希望对大家有所帮助,如有... 目录Navicat数据表数据添加,删除及使用sql完成数据添加选中操作的表则出现如下界面,查看左下角从左

SpringBoot中4种数据水平分片策略

《SpringBoot中4种数据水平分片策略》数据水平分片作为一种水平扩展策略,通过将数据分散到多个物理节点上,有效解决了存储容量和性能瓶颈问题,下面小编就来和大家分享4种数据分片策略吧... 目录一、前言二、哈希分片2.1 原理2.2 SpringBoot实现2.3 优缺点分析2.4 适用场景三、范围分片

一文详解Java Stream的sorted自定义排序

《一文详解JavaStream的sorted自定义排序》Javastream中的sorted方法是用于对流中的元素进行排序的方法,它可以接受一个comparator参数,用于指定排序规则,sorte... 目录一、sorted 操作的基础原理二、自定义排序的实现方式1. Comparator 接口的 Lam

Java Stream的distinct去重原理分析

《JavaStream的distinct去重原理分析》Javastream中的distinct方法用于去除流中的重复元素,它返回一个包含过滤后唯一元素的新流,该方法会根据元素的hashcode和eq... 目录一、distinct 的基础用法与核心特性二、distinct 的底层实现原理1. 顺序流中的去重

Redis分片集群、数据读写规则问题小结

《Redis分片集群、数据读写规则问题小结》本文介绍了Redis分片集群的原理,通过数据分片和哈希槽机制解决单机内存限制与写瓶颈问题,实现分布式存储和高并发处理,但存在通信开销大、维护复杂及对事务支持... 目录一、分片集群解android决的问题二、分片集群图解 分片集群特征如何解决的上述问题?(与哨兵模

浅析如何保证MySQL与Redis数据一致性

《浅析如何保证MySQL与Redis数据一致性》在互联网应用中,MySQL作为持久化存储引擎,Redis作为高性能缓存层,两者的组合能有效提升系统性能,下面我们来看看如何保证两者的数据一致性吧... 目录一、数据不一致性的根源1.1 典型不一致场景1.2 关键矛盾点二、一致性保障策略2.1 基础策略:更新数