TRB 2024论文分享:一种基于Swin Transformer的车标识别新方法

2024-01-18 12:52

本文主要是介绍TRB 2024论文分享:一种基于Swin Transformer的车标识别新方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

TRB(Transportation Research Board,美国交通研究委员会,简称TRB)会议是交通研究领域知名度最高学术会议之一,近年来的参会人数已经超过了2万名,是参与人数和国家最多的学术盛会。TRB会议几乎涵盖了交通领域的所有主题,主要包括公路、铁路、水运、航空、管道等诸多领域,接收来自交通系统、交通工程、交通政策、交通管理、交通实际操作、政府研究、学术研究和工业界最新的研究成果。TRB会议的论文反映了交通领域的研究前沿,具有广泛的参考价值。

本文主要介绍我们在交通领域被TRB 2024接收的关于车辆身份识别的研究工作,论文的题目为《A New Method for Vehicle Logo Recognition Based on Swin Transformer》,第一作者为李杨。车标识别是实现车辆身份识别的核心任务之一,高效的车标识别方法能够有效地识别车辆品牌,进而可以实现车辆跟踪或者车辆品牌市场占有率估计等目标。目前,基于卷积神经网络(CNN)的车标识别方法被广泛应用。然而,CNN的全局建模能力仍然低效,进而使车标识别方法难以突破性能瓶颈。为了解决上述问题,本文使用Swin Transformer实现实时的车标识别并对其进行微调以获得最佳性能。在三个公开车标数据集(HFUT-VL1、XMU、CTGU-VLD)上进行的广泛实验证明了本文方法的优越性。

1. 背景与挑战

(1) 车标特征提取仍不够充分

车标属于小目标,大多数据集采集到的车标图像往往具有较低的分辨率。通过研究发现,捕获车标的细节特征往往能够大幅提高准确率。基于CNN的车标识别方法往往是通过增加网络层数以提取车标更抽象的语义特征。然而,这种方法提高了计算成本,并且会导致梯度爆炸和梯度消失等问题出现。Transformer中的注意力机制能够进行高效的并行计算并轻松捕获抽象的语义特征。因此,本文聚焦使用Transformer中的注意力机制对车标特征进行处理。

(2) CNN全局建模效率较低

在现有的车标识别方法中,基于CNN的方法被大多数研究者重点关注。尽管CNN通过核卷积能够轻松实现空间局部性特征提取,并通过平移卷积来增大感受野以提取丰富的特征。但是,CNN的全局建模效率仍然较低,进而难以突破其性能瓶颈。因此,我们使用Swin Transformer模型,先通过窗口化的注意力机制对车标图像进行局部建模,再利用滑动窗口的方法对每个窗口进行全局建模,以较低的计算代价提高全局建模效率。

2. 方法

图1 基于Swin Transformer的车标识别方法的整体架构

基于Swin Transformer的车标识别方法的整体架构如图1所示。首先,输入的RGB车标图像被分割成互不重叠的patch,其中每个patch可以被视为一个“token”。其次,这些token的原始通道维度通过Linear Embedding投影到任意维度。接下来,多个 Swin Transformer模块以及Patch Merging模块将应用于这些token。最后,与CNN类似,特征向量通过Linear layer映射到与类别数相同维度的输出向量,用于车辆标志的分类。此外,如图2所示,Swin Transformer的高效全局建模在于其独特的窗口注意力计算策略,具体而言,通过W-MSA处理每个独立窗口的特征,再通过SW-MSA建立窗口之间的特征依赖关系,进而实现复杂度与图像尺寸大小成线性关系的高效建模。总之,本文提出的基于Swin Transformer的车标识别方法能够高效提取车标特征进而实现分类,并且该方法具有较低的复杂度和较强的泛化能力。

图2 SW-MSA的注意力计算

3. 实验结果

实验使用的车标公开数据集包括HFUT-VL1、XMU和CTGU-VLD数据集。车标识别方法性能的评价指标主要是准确率(%)和处理速度(image/s)。通过微调Swin Transformer结构参数来提高模型性能,并获得最佳结果。为验证本文方法在车标识别中的有效性,我们在上述三种数据集上进行了两组对比试验。实验结果表明,与对比的车标识别方法相比,本文方法识别准确率和处理速度等方面具有良好的性能

4. 总结

本文提出的基于Swin Transformer车标识别方法实现了实时车标识别,并在多个公开数据集上表现出色。更为重要的是,本文提出的方法以较低的复杂度全面提升了车标识别的性能。未来的研究可以探索将车标识别与车牌、车型和车辆颜色等其它特征的综合识别相结合,进一步全面提升车辆身份识别的性能。

这篇关于TRB 2024论文分享:一种基于Swin Transformer的车标识别新方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/619054

相关文章

问题:第一次世界大战的起止时间是 #其他#学习方法#微信

问题:第一次世界大战的起止时间是 A.1913 ~1918 年 B.1913 ~1918 年 C.1914 ~1918 年 D.1914 ~1919 年 参考答案如图所示

[职场] 护理专业简历怎么写 #经验分享#微信

护理专业简历怎么写   很多想成为一名护理方面的从业者,但是又不知道应该怎么制作一份简历,现在这里分享了一份护理方面的简历模板供大家参考。   蓝山山   年龄:24   号码:12345678910   地址:上海市 邮箱:jianli@jianli.com   教育背景   时间:2011-09到2015-06   学校:蓝山大学   专业:护理学   学历:本科

[word] word设置上标快捷键 #学习方法#其他#媒体

word设置上标快捷键 办公中,少不了使用word,这个是大家必备的软件,今天给大家分享word设置上标快捷键,希望在办公中能帮到您! 1、添加上标 在录入一些公式,或者是化学产品时,需要添加上标内容,按下快捷键Ctrl+shift++就能将需要的内容设置为上标符号。 word设置上标快捷键的方法就是以上内容了,需要的小伙伴都可以试一试呢!

大学湖北中医药大学法医学试题及答案,分享几个实用搜题和学习工具 #微信#学习方法#职场发展

今天分享拥有拍照搜题、文字搜题、语音搜题、多重搜题等搜题模式,可以快速查找问题解析,加深对题目答案的理解。 1.快练题 这是一个网站 找题的网站海量题库,在线搜题,快速刷题~为您提供百万优质题库,直接搜索题库名称,支持多种刷题模式:顺序练习、语音听题、本地搜题、顺序阅读、模拟考试、组卷考试、赶快下载吧! 2.彩虹搜题 这是个老公众号了 支持手写输入,截图搜题,详细步骤,解题必备

电脑不小心删除的文件怎么恢复?4个必备恢复方法!

“刚刚在对电脑里的某些垃圾文件进行清理时,我一不小心误删了比较重要的数据。这些误删的数据还有机会恢复吗?希望大家帮帮我,非常感谢!” 在这个数字化飞速发展的时代,电脑早已成为我们日常生活和工作中不可或缺的一部分。然而,就像生活中的小插曲一样,有时我们可能会在不经意间犯下一些小错误,比如不小心删除了重要的文件。 当那份文件消失在眼前,仿佛被时间吞噬,我们不禁会心生焦虑。但别担心,就像每个问题

[职场] 公务员的利弊分析 #知识分享#经验分享#其他

公务员的利弊分析     公务员作为一种稳定的职业选择,一直备受人们的关注。然而,就像任何其他职业一样,公务员职位也有其利与弊。本文将对公务员的利弊进行分析,帮助读者更好地了解这一职业的特点。 利: 1. 稳定的职业:公务员职位通常具有较高的稳定性,一旦进入公务员队伍,往往可以享受到稳定的工作环境和薪资待遇。这对于那些追求稳定的人来说,是一个很大的优势。 2. 薪资福利优厚:公务员的薪资和

创新、引领、发展——SAMPE中国2024年会在京盛大开幕

绿树阴浓夏日长,在这个色彩缤纷的季节,SAMPE中国2024年会暨第十九届国际先进复合材料制品原材料、工装及工程应用展览会在中国国际展览中心(北京朝阳馆)隆重开幕。新老朋友共聚一堂,把酒话桑麻。 为期4天的国际学术会议以“先进复合材料,引领产业创新与可持续化发展”为主题,设立了34个主题分会场,其中包括了可持续化会场、国际大学生会场、中法复合材料制造技术峰会三个国际会场和女科技工作者委员会沙龙,

android一键分享功能部分实现

为什么叫做部分实现呢,其实是我只实现一部分的分享。如新浪微博,那还有没去实现的是微信分享。还有一部分奇怪的问题:我QQ分享跟QQ空间的分享功能,我都没配置key那些都是原本集成就有的key也可以实现分享,谁清楚的麻烦详解下。 实现分享功能我们可以去www.mob.com这个网站集成。免费的,而且还有短信验证功能。等这分享研究完后就研究下短信验证功能。 开始实现步骤(新浪分享,以下是本人自己实现

邮件群发推送的方法技巧?有哪些注意事项?

邮件群发推送的策略如何实现?邮件推送怎么评估效果? 电子邮件营销是现代企业进行推广和沟通的重要工具。有效的邮件群发推送不仅能提高客户参与度,还能促进销售增长。AokSend将探讨一些关键的邮件群发推送方法和技巧,以帮助企业优化其邮件营销策略。 邮件群发推送:目标受众 了解他们的需求、兴趣和行为习惯有助于你设计出更具吸引力和相关性的邮件内容。通过收集和分析数据,创建详细的客户画像,可以更精

基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别

转发来源:https://swift.ctolib.com/ooooverflow-chinese-ocr.html chinese-ocr 基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别 环境部署 sh setup.sh 使用环境: python 3.6 + tensorflow 1.10 +pytorch 0.4.1 注:CPU环境