更换数据集导致错误OSError: Unrecognized data stream contents when reading image file

本文主要是介绍更换数据集导致错误OSError: Unrecognized data stream contents when reading image file,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 查找错误
  • 打印错误文件并查看其二进制开头
  • 移动文件
  • 补充,将后缀是png但实际是jpg图像转换为png图像

查找错误

比如我的png格式图片要一样的开头时

def is_valid_image(path):try:bValid = Truefileobj = open(path, 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\x89PNG'):  # 是否以\x89PNG开头 表示PNGbValid = Falseprint(buf)else:try:Image.open(fileobj).verify()except Exception as e:bValid = Falseexcept Exception as e:return Falsereturn bValid

jpg格式

def is_valid_image(path):try:bValid = Truefileobj = open(path, 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\xff\xd8'):  # 是否以\xff\xd8开头 表示JPEG(jpg)bValid = Falseelse:try:Image.open(fileobj).verify()except Exception as e:bValid = Falseexcept Exception as e:return Falsereturn bValid

打印错误文件并查看其二进制开头

以png为例,如果不想看二进制开头可注释掉print(buf)

import os
from PIL import Image
import shutildef is_valid_image(path):try:bValid = Truefileobj = open(path, 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\x89PNG'):  # 是否以\x89PNG开头 表示PNGbValid = Falseprint(buf)else:try:Image.open(fileobj).verify()except Exception as e:bValid = Falseexcept Exception as e:return Falsereturn bValiddef is_call_valid(path, move_to_path):# 遍历图像夹下所有图像 root:根目录  dirs:根目录下所有目录(文件夹):files: 包含所有图像的一个listfor root, dirs, files in os.walk(path):for img_file in files:# 组合图像的绝对路径img_file_path = os.path.join(root, img_file)# 调用图像判断函数flag = is_valid_image(img_file_path)# 判断图像是否损坏,若是则移动到失效文件路径中if flag == False:# this delete can not restore# os.remove(img_file_path)print(img_file_path)# 移动文件# shutil.move(img_file_path, move_to_path)# print(img_file_path)# is_call_valid('./dataset/train_data/ors-4199/gt','./fail ors-4199')
is_call_valid('./dataset/train_data/RSISOD/gt','./fail RSISOD')

移动文件

import os
from PIL import Image
import shutildef is_valid_image(path):try:bValid = Truefileobj = open(path, 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\x89PNG'):  # 是否以\x89PNG开头 表示PNGbValid = Falseelse:try:Image.open(fileobj).verify()except Exception as e:bValid = Falseexcept Exception as e:return Falsereturn bValiddef is_call_valid(path, move_to_path):# 遍历图像夹下所有图像 root:根目录  dirs:根目录下所有目录(文件夹):files: 包含所有图像的一个listfor root, dirs, files in os.walk(path):for img_file in files:# 组合图像的绝对路径img_file_path = os.path.join(root, img_file)# 调用图像判断函数flag = is_valid_image(img_file_path)# 判断图像是否损坏,若是则移动到失效文件路径中if flag == False:# this delete can not restore# os.remove(img_file_path)# 移动文件shutil.move(img_file_path, move_to_path)# print(img_file_path)is_call_valid('./dataset/train_data/ors-4199/gt','./fail ors-4199')
is_call_valid('./dataset/train_data/RSISOD/gt','./fail RSISOD')

补充,将后缀是png但实际是jpg图像转换为png图像

from PIL import Image
import os# 设置输入文件夹路径和目标格式
input_folder = './dataset/train_data/RSISOD/gt/pool'
target_format = 'png'# 循环遍历输入文件夹中的所有文件
for filename in os.listdir(input_folder):# 检查文件是否为jpg格式fileobj = open(os.path.join(input_folder, filename), 'rb')  # 以二进制打开文件buf = fileobj.read()if not buf.startswith(b'\x89PNG'):# 组合新的文件名和路径img_path_jpg = os.path.join(input_folder, filename)img_path_png = os.path.splitext(img_path_jpg)[0] +'!'+ '.' + target_format# 读取JPG格式图片并保存为PNG格式with Image.open(img_path_jpg) as img:img.save(img_path_png)# 删除原始JPG格式图片os.remove(img_path_jpg)

这篇关于更换数据集导致错误OSError: Unrecognized data stream contents when reading image file的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/305791

相关文章

Python数据验证神器Pydantic库的使用和实践中的避坑指南

《Python数据验证神器Pydantic库的使用和实践中的避坑指南》Pydantic是一个用于数据验证和设置的库,可以显著简化API接口开发,文章通过一个实际案例,展示了Pydantic如何在生产环... 目录1️⃣ 崩溃时刻:当你的API接口又双叒崩了!2️⃣ 神兵天降:3行代码解决验证难题3️⃣ 深度

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

《MySQL快速复制一张表的四种核心方法(包括表结构和数据)》本文详细介绍了四种复制MySQL表(结构+数据)的方法,并对每种方法进行了对比分析,适用于不同场景和数据量的复制需求,特别是针对超大表(1... 目录一、mysql 复制表(结构+数据)的 4 种核心方法(面试结构化回答)方法 1:CREATE

详解C++ 存储二进制数据容器的几种方法

《详解C++存储二进制数据容器的几种方法》本文主要介绍了详解C++存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::ve... 目录1.std::vector<uint8_t>(最常用)特点:适用场景:示例:2.std::arra

SpringBoot项目整合Netty启动失败的常见错误总结

《SpringBoot项目整合Netty启动失败的常见错误总结》本文总结了SpringBoot集成Netty时常见的8类问题及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参... 目录一、端口冲突问题1. Tomcat与Netty端口冲突二、主线程被阻塞问题1. Netty启动阻

SpringBoot整合Kafka启动失败的常见错误问题总结(推荐)

《SpringBoot整合Kafka启动失败的常见错误问题总结(推荐)》本文总结了SpringBoot项目整合Kafka启动失败的常见错误,包括Kafka服务器连接问题、序列化配置错误、依赖配置问题、... 目录一、Kafka服务器连接问题1. Kafka服务器无法连接2. 开发环境与生产环境网络不通二、序

SpringCloud Stream 快速入门实例教程

《SpringCloudStream快速入门实例教程》本文介绍了SpringCloudStream(SCS)组件在分布式系统中的作用,以及如何集成到SpringBoot项目中,通过SCS,可... 目录1.SCS 组件的出现的背景和作用2.SCS 集成srping Boot项目3.Yml 配置4.Sprin

MySQL中的DELETE删除数据及注意事项

《MySQL中的DELETE删除数据及注意事项》MySQL的DELETE语句是数据库操作中不可或缺的一部分,通过合理使用索引、批量删除、避免全表删除、使用TRUNCATE、使用ORDERBY和LIMI... 目录1. 基本语法单表删除2. 高级用法使用子查询删除删除多表3. 性能优化策略使用索引批量删除避免

MySQL 数据库进阶之SQL 数据操作与子查询操作大全

《MySQL数据库进阶之SQL数据操作与子查询操作大全》本文详细介绍了SQL中的子查询、数据添加(INSERT)、数据修改(UPDATE)和数据删除(DELETE、TRUNCATE、DROP)操作... 目录一、子查询:嵌套在查询中的查询1.1 子查询的基本语法1.2 子查询的实战示例二、数据添加:INSE

Linux服务器数据盘移除并重新挂载的全过程

《Linux服务器数据盘移除并重新挂载的全过程》:本文主要介绍在Linux服务器上移除并重新挂载数据盘的整个过程,分为三大步:卸载文件系统、分离磁盘和重新挂载,每一步都有详细的步骤和注意事项,确保... 目录引言第一步:卸载文件系统第二步:分离磁盘第三步:重新挂载引言在 linux 服务器上移除并重新挂p

使用MyBatis TypeHandler实现数据加密与解密的具体方案

《使用MyBatisTypeHandler实现数据加密与解密的具体方案》在我们日常的开发工作中,经常会遇到一些敏感数据需要存储,比如用户的手机号、身份证号、银行卡号等,为了保障数据安全,我们通常会对... 目录1. 核心概念:什么是 TypeHandler?2. 实战场景3. 代码实现步骤步骤 1:定义 E