华录杯-江苏违法广告检测-冠军总结

2023-10-20 07:59

本文主要是介绍华录杯-江苏违法广告检测-冠军总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

摘要

通过大概一年的学习,自己也是成功夺得一次检测方面的冠军,这个比赛属于目标检测但不是传统的检测任务,是一个非常具有挑战的比赛,让我从中受益匪浅和延伸出很多的idea。接下来就整体的讲解一下此次比赛。比赛连接

赛题理解

本次比赛提供合法数据集(无标签数据)和违法数据集(有标签数据)其中本次得分为0.2的acc和0.8的map得分共同组成,我们要完成分类合法数据检测违法数据。这里就不同于我们以往的目标检测任务,我们需要先进行分类在检测,那么我们我们该如何完成这个任务。分类任务我们其实就通过阈值调成和类别判定来进行分类,比如在双阶段检测器中判定为背景和置信度低于0.3以下,我们就认为它为合法数据,分类完成之后就可以进行检测任务了,输出置信度0.3以上就完成了检测任务。
在这里插入图片描述
这个赛题最难的点在于分类不再是通过标注框内信息进行分类。一样的广告牌在不同的位置就会有不同的类别。比如遮挡照片和一店多招,遮挡照片可以很清晰的看到标注框内大部分只有广告信息,但是类别判定主要是由于框内特征和背景特征共同决定。一店多招也是一张照片中由于一个店铺贴了二张广告,这个类别判定是属于框与框之前的关系。所以这就导致这个赛题很难得分。最主要是现有的目标检测框架不足以满足这些任务需求。
在这里插入图片描述

核心技巧

这个赛题最主要的是如何利用合法数据集,因为合法数据集你是没用标签数据的。如果你不利用违法数据集训练模型很难得到acc部分的得分,这个时候就可以先利用违法数据集训练一个基础模型,以双阶段模型为例,你可以预测全部的合法数据集生成json标注,类别全部为0,在双阶段模型中,0就是背景,这样就能利用上更多的负样本进行训练。即使这样分类得分在0.7左右,很难突破到0.8分。得到标注文件就可以进行训练了,这个时候合法数据集和违法数据集一起重新训练,在这其中,我模型之前的albu和一些其他的策略都是测试出来过知道那个能上分的。所以无论是我在训练基础模型还是训练最终模型的过程,始终一直加入很多的策略。

这些策略包括13中数据增强,数据增强一共有三大类别。第一种是图像转动,上下左右转置,第二种是色调调整,第三种是改变图像信息,比如cutout和mosaic。在这个赛题,改变图像信息的数据增强基本都是掉分的策略,本身这个赛题正负样本可以完全都是广告牌,只是背景不同。所以图像信息很重要。第三类的数据增强测试了几种都没能提升分数。其他策略使用了SEPC,Giou loss,res2net,DCN 多尺度训练和余弦退火策略。这些基本都是属于涨点策略。

初赛思路

初赛,其实由于数据量还是太少,分类效果还是双阶段模型效果更好,这里双阶段模型和单阶段最大的差异是双阶段本身就会为类别自动添加背景类别,所以在利用负样本,在数据量少的情况下,产生更多的负样本,分类效果优于atss单阶段模型
在这里插入图片描述

复赛思路

在数据量又增加的情况下,使用的res2net101强大的前置网络模型学习能力在分类还是map预测效果都会优于双阶段模型。这里单阶段为什么会优于双阶段模型,最主要是atss策略产生的正负样本有区别,和不同的级联检测器相比,atss策略产生的正负样本框的质量更优,而这次比赛其实不需要级联那样提供太过准确的框,如果先验框和真实标注框有差异是最好的,这样还能提取到额外的背景使得分类效果更好一点。
在这里插入图片描述

算法模型

在这里插入图片描述
在训练模型的时候更多是靠经验去感知那部分可以带来影响,就不如albu这个部分,在普通的目标检测任务会用albu和不会用albu涨分幅度会差别很大。其他策略就通过理论去猜测可能会很有用然后实验去验证。

总结

比赛其实更多的是尝试自己的想法会不会更好,这些都是平时看论文写代码给自己对模型训练上的感悟。还需要一定的代码功底去实现各种功能。我主要是在kaggle的水稻检测比赛学到很多东西。国内竞赛一般代码不会开源。大家常去kaggle和cv的最新论文多留意比赛之类的。这个新颖的比赛其实更重要的起到一个启示的作用。现有的目标检测框架如果说是要类比人的话,只是最简单的认识大概物体轮廓。我觉得是可以利用深度学习从目标检测的“认识”->“理解”。举个简单例子,火,在森林中的火和在火炉中的火意义完全不同。目前的只能检测出是火,不能知道它在这个位置所存在的意义。那么我们其实就可以顺着这个思路继续深入研究。这个研究的目的就是让视觉更加智能。会让目标检测的应用场景更加广阔。这个课题我会上研究生在深入研究。

这篇关于华录杯-江苏违法广告检测-冠军总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/245779

相关文章

Android数据库Room的实际使用过程总结

《Android数据库Room的实际使用过程总结》这篇文章主要给大家介绍了关于Android数据库Room的实际使用过程,详细介绍了如何创建实体类、数据访问对象(DAO)和数据库抽象类,需要的朋友可以... 目录前言一、Room的基本使用1.项目配置2.创建实体类(Entity)3.创建数据访问对象(DAO

Java向kettle8.0传递参数的方式总结

《Java向kettle8.0传递参数的方式总结》介绍了如何在Kettle中传递参数到转换和作业中,包括设置全局properties、使用TransMeta和JobMeta的parameterValu... 目录1.传递参数到转换中2.传递参数到作业中总结1.传递参数到转换中1.1. 通过设置Trans的

C# Task Cancellation使用总结

《C#TaskCancellation使用总结》本文主要介绍了在使用CancellationTokenSource取消任务时的行为,以及如何使用Task的ContinueWith方法来处理任务的延... 目录C# Task Cancellation总结1、调用cancellationTokenSource.

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

整数Hash散列总结

方法:    step1  :线性探测  step2 散列   当 h(k)位置已经存储有元素的时候,依次探查(h(k)+i) mod S, i=1,2,3…,直到找到空的存储单元为止。其中,S为 数组长度。 HDU 1496   a*x1^2+b*x2^2+c*x3^2+d*x4^2=0 。 x在 [-100,100] 解的个数  const int MaxN = 3000