谷歌大脑团队:ImageNet错误数据分析

2023-12-06 17:59

本文主要是介绍谷歌大脑团队:ImageNet错误数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原文:Vasudevan V, Caine B, Gontijo-Lopes R, et al. When does dough become a bagel? Analyzing the remaining mistakes on ImageNet[J]. arXiv preprint arXiv:2205.04596, 2022.

源码:https://github.com/google-research/imagenet-mistakes

过去十年,ImageNet数据集上的图像分类精度一直是计算机视觉进步的晴雨表。最近的几篇论文质疑了该基准对社区的有用程度,然而算法创新仍然有助于提高模型性能,当今最大的模型达到了90%以上的Top-1精度。为了给当今最先进的模型提供更有意义的评估,我们手动审查和分类了一些顶级模型所犯的每一个错误。我们聚焦ImageNet的多标签子集评估,在这个数据集上,当今最好的模型达到了97%以上的Top-1精度。

我们的分析表明,近一半所谓的“错误”根本不是错误,如果不仔细审查,我们将明显低估这些模型的性能。另一方面,我们还发现,当今最好的模型仍然会犯大量错误(40%),这些错误在人类审查员看来显然是错误的。为了校准未来在ImageNet上的进展,我们提供了一个更新的多标签评估集,并精心制作了ImageNet-Major数据集:当今顶级模型所犯错误中的68个“重大错误”示例,在这个数据集上,模型应该达到近乎完美的水平,但今天远非如此。

面团?百吉饼?傻傻分不清楚。

图1:错误的严重程度。模型对(a)和(b)预测错误。模型对(c)预测正确,但是图中出现了多目标,而标签只有一个,模型预测出了丢失的标签。模型对(d)的预测是正确的,不过(d)的标签“蜜蜂”是错误的,图中的昆虫是bee-fly,它是一种苍蝇。

图2:模型预测错误的4类示例。(b)的标签是“注射器”,图中的动物是毛丝鼠(不属于ImageNet类),但在视觉上类似于仓鼠(属于ImageNet类),因此模型将其预测成了仓鼠。(c)的标签是“鼠标、桌子、显示器、屏幕”,但模型将其预测为“台式计算机”,而图中并没有台式计算机。

表1:ViT-3B模型在重新标记前后的多标签准确率(Multi-label accuracy, MLA)。

表2:ViT-3B和Greedy Soups模型的错误类型与严重程度。

容易混淆的类别对出现的频率,这种分布在本质上是长尾的。最容易混淆的类别对是(美洲变色龙,绿蜥蜴)和(马达加斯加猫,大狐猴)。

表3:ViT-3B、Greedy Soups和最佳人类表现的多标签准确率的比较。

表4:删除泄漏的训练示例对模型性能的影响。

图3:伪相关示例。

图4:我们为审查模型预测而构建的UI截图。对于每张图像,我们会确定模型预测是正确的、错误的还是不清楚的。如果图像的标签不正确,我们会将图像标记为有问题的。

图5:我们构建的类别搜索工具的截图。

图6:重大错误的更多示例。

图7:较小错误的更多示例。

图8:纠正“错误”。模型预测正确,我们将模型预测结果添加到原始的多标签注释中。

图9:有问题的“错误”。图像或其原始标签有问题,不应出现在验证集中。

图10:细粒度错误。

图11:OOV(Out-of-vocabulary)细粒度错误。

图12:伪关联示例。“Over-reliance on context”表明图像中的线索与预测类别相关,尽管预测类别并不存在。“Lack of context”表明模型未能理解图像中的语境,并预测了与图像整体理解不一致的类别。

图13:非典型错误,例如狗品种中的小狗,或该类别中的异常/独特版本。

图14:困难样本。针对第一行图像,人类容易分类错误,但是模型却分类正确。针对第二行图像,人类容易分类正确,但是模型却分类错误。

图15:接近重复的示例。

图16:接近重复的示例。

在本文中,我们分析了ViT-3B和Greedy soup模型在ImageNet多标签验证集上所犯的每一个错误。我们发布了ImageNet-M数据集,这是一个包含68个示例的多标签评估子集,用于衡量模型解决重大、明确错误的能力。

多模态人工智能

为人类文明进步而努力奋斗^_^↑

欢迎关注“多模态人工智能”公众号^_^↑

这篇关于谷歌大脑团队:ImageNet错误数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/462760

相关文章

解决mybatis-plus-boot-starter与mybatis-spring-boot-starter的错误问题

《解决mybatis-plus-boot-starter与mybatis-spring-boot-starter的错误问题》本文主要讲述了在使用MyBatis和MyBatis-Plus时遇到的绑定异常... 目录myBATis-plus-boot-starpythonter与mybatis-spring-b

Python:豆瓣电影商业数据分析-爬取全数据【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】

**爬取豆瓣电影信息,分析近年电影行业的发展情况** 本文是完整的数据分析展现,代码有完整版,包含豆瓣电影爬取的具体方式【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】   最近MBA在学习《商业数据分析》,大实训作业给了数据要进行数据分析,所以先拿豆瓣电影练练手,网络上爬取豆瓣电影TOP250较多,但对于豆瓣电影全数据的爬取教程很少,所以我自己做一版。 目

【经验交流】修复系统事件查看器启动不能时出现的4201错误

方法1,取得『%SystemRoot%\LogFiles』文件夹和『%SystemRoot%\System32\wbem』文件夹的权限(包括这两个文件夹的所有子文件夹的权限),简单点说,就是使你当前的帐户拥有这两个文件夹以及它们的子文件夹的绝对控制权限。这是最简单的方法,不少老外说,这样一弄,倒是解决了问题。不过对我的系统,没用; 方法2,以不带网络的安全模式启动,运行命令行,输入“ne

全英文地图/天地图和谷歌瓦片地图杂交/设备分布和轨迹回放/无需翻墙离线使用

一、前言说明 随着风云局势的剧烈变化,对我们搞软件开发的人员来说,影响也是越发明显,比如之前对美对欧的软件居多,现在慢慢的变成了对大鹅和中东以及非洲的居多,这两年明显问有没有俄语或者阿拉伯语的输入法的增多,这要是放在2019年以前,一年也遇不到一个人问这种需求场景的。 地图应用这块也是,之前的应用主要在国内,现在慢慢的多了一些外国的应用场景,这就遇到一个大问题,我们平时主要开发用的都是国内的地

Science Robotics 首尔国立大学研究团队推出BBEX外骨骼,实现多维力量支持!

重复性举起物体可能会对脊柱和背部肌肉造成损伤,由此引发的腰椎损伤是工业环境等工作场所中一个普遍且令人关注的问题。为了减轻这类伤害,有研究人员已经研发出在举起任务中为工人提供辅助的背部支撑装置。然而,现有的这类装置通常无法在非对称性的举重过程中提供多维度的力量支持。此外,针对整个人体脊柱的设备安全性验证也一直是一个缺失的环节。 据探索前沿科技边界,传递前沿科技成果的X-robot投稿,来自首尔国立

SQL2005 性能监视器计数器错误解决方法

【系统环境】 windows 2003 +sql2005 【问题状况】 用户在不正当删除SQL2005后会造成SQL2005 性能监视器计数器错误,如下图 【解决办法】 1、在 “开始” --> “运行”中输入 regedit,开启注册表编辑器,定位到 [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVer

ssm 之事务管理出现错误

JDBC Connection will not be managed by Spring 项目采用的是分布式架构,分别有controller,service,solr三个服务器,之间通过dubbo进行调用,经过测试发现事务配置完以后不能通过spring进行管理,其中两条insert和一条update语句都执行完毕,异常并没有使得事务进行回滚,通过调取debug日志发现“JDBC Conn

Unstructured cannot write mode RGBA as JPEG 错误解决

Unstructured cannot write mode RGBA as JPEG 错误解决 0. 错误详细1. 解决方法 0. 错误详细 Image Extraction Error: Skipping the failed imageTraceback (most recent call last):File "/root/miniconda3/envs/learn-y

收藏:解决 pip install 出现 error: subprocess-exited-with-error 错误的方法

在使用 pip 安装 Python 包时,有时候会遇到 error: subprocess-exited-with-error 错误。这种错误通常是由于 setuptools 版本问题引起的。本文将介绍如何解决这一问题 当你使用 pip install 安装某个 Python 包时,如果 setuptools 版本过高或过低,可能会导致安装过程出错,并出现类似以下错误信息:error: subpr

插件:清理maven错误缓存.bat

插件:https://pan.baidu.com/s/1nHIxHoo1C4MvFlW7QbZe5Q?pwd=7zenhttps://pan.baidu.com/s/1nHIxHoo1C4MvFlW7QbZe5Q?pwd=7zen没错误缓存时: 有错误缓存时: