Debug日记:为什么神经网络测试精度远低于验证精度??都是模式“P”惹的祸!!

2024-02-14 14:59

本文主要是介绍Debug日记:为什么神经网络测试精度远低于验证精度??都是模式“P”惹的祸!!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

事情背景

最近在做一个图像分割的项目,数据集是自己制作的VOC格式的分割数据集,在之前的博客中,我发现了VOC数据集的ground turth是8位的彩色图像

后来查了很多资料,暂时只找到PIL.Image有的调色板模式“P”是8位的彩色图像。于是将训练集、验证集都转换为模式“P”之后就开始训练了

经过了艰苦的调参,模型终于不会过拟合了,但是在测试的时候却发现,测试的精度接近于瞎猜(二分类)。
在这里插入图片描述
起初以为是模型的问题或者验证集的标签泄露。但是冷静分析一下,肯定不是过拟合,原因有二:

  1. 如果验证集的标签泄露,那么不可能需要那么小心地设计学习率,它才不会过拟合,而是随便设计学习率都可以完美地拟合
  2. 就算它泄露了,就算模型泛化能力极差,也不至于完全是瞎猜的状态。

在仔细检查了代码之后,感觉可能是因为模式“P”的原因!经过了实验,终于定位了问题,就是模式"P"惹的祸!!

>>> import numpy as np
>>> test = np.zeros((2,2,3),dtype="uint8")
>>> test[0][1]=[1,1,1]
>>> test
array([[[0, 0, 0],[1, 1, 1]],[[0, 0, 0],[0, 0, 0]]], dtype=uint8)
>>> import numpy as np
>>> test = np.ones((2,2,3),dtype="uint8")
>>> test[0][1]=[0,0,0]
>>> test
array([[[1, 1, 1],[0, 0, 0]],[[1, 1, 1],[1, 1, 1]]], dtype=uint8)
>>> from PIL import Image
>>> img1 = Image.fromarray(test)
>>> L1 = img1.convert("L")
>>> P1 = L1.convert("P")
>>> img2 = Image.fromarray(test)
>>> P2 = img2.convert("P")
>>> P1 == P2
False
>>> np.array(P1.convert("RGB"))
array([[[1, 1, 1],[0, 0, 0]],[[1, 1, 1],[1, 1, 1]]], dtype=uint8)
>>> np.array(P2.convert("RGB"))
array([[[0, 0, 0],[0, 0, 0]],[[0, 0, 0],[0, 0, 0]]], dtype=uint8)

see?一张RGB的图像,用PIL.Image.Open.convert直接转化为模式“P”的结果,和先转化为模式“L”再转化为模式“P”是不一样的!!!

我在生成训练集和验证集的时候,将RGB的图像转化为模式“L”,再转化为模式“P”。而在生成验证集的时候,直接将RGB的图像直接转化为了模式“P”。就是这一个不起眼的失误浪费了几天的时间!

至于为什么二值的RGB直接转模式P会得到全0的矩阵,小弟还没想明白,希望评论区有高人解答!!

这篇关于Debug日记:为什么神经网络测试精度远低于验证精度??都是模式“P”惹的祸!!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/708816

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

字节面试 | 如何测试RocketMQ、RocketMQ?

字节面试:RocketMQ是怎么测试的呢? 答: 首先保证消息的消费正确、设计逆向用例,在验证消息内容为空等情况时的消费正确性; 推送大批量MQ,通过Admin控制台查看MQ消费的情况,是否出现消费假死、TPS是否正常等等问题。(上述都是临场发挥,但是RocketMQ真正的测试点,还真的需要探讨) 01 先了解RocketMQ 作为测试也是要简单了解RocketMQ。简单来说,就是一个分

在JS中的设计模式的单例模式、策略模式、代理模式、原型模式浅讲

1. 单例模式(Singleton Pattern) 确保一个类只有一个实例,并提供一个全局访问点。 示例代码: class Singleton {constructor() {if (Singleton.instance) {return Singleton.instance;}Singleton.instance = this;this.data = [];}addData(value)

【测试】输入正确用户名和密码,点击登录没有响应的可能性原因

目录 一、前端问题 1. 界面交互问题 2. 输入数据校验问题 二、网络问题 1. 网络连接中断 2. 代理设置问题 三、后端问题 1. 服务器故障 2. 数据库问题 3. 权限问题: 四、其他问题 1. 缓存问题 2. 第三方服务问题 3. 配置问题 一、前端问题 1. 界面交互问题 登录按钮的点击事件未正确绑定,导致点击后无法触发登录操作。 页面可能存在

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目: 题解: class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

模版方法模式template method

学习笔记,原文链接 https://refactoringguru.cn/design-patterns/template-method 超类中定义了一个算法的框架, 允许子类在不修改结构的情况下重写算法的特定步骤。 上层接口有默认实现的方法和子类需要自己实现的方法