本文主要是介绍杂色背景验证码预处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
最近做验证码的时候遇到了一个杂色背景验证码识别的问题,虽然可以通过finetune的方式直接解决识别问题,但是为了减少标注量和额外的工作,考虑通过图像处理的方式去除背景提取文字,然后只需要直接掉用现有识别模型就行了。没查到比较好的办法,自己琢磨了一下,大家可以参考一下我的思路。
验证码图像长这样:
整体思路比较简单,弱化背景,把文字给提取出来。
首先,需要考虑如何减少杂色的干扰,由于背景杂色都是短线条和色点,最直接的方式就是使用滤波将杂色过滤掉,采用中值滤波可以弱化背景影响。
背景杂色基本不明显了,可是文字本身也不明显了😂。
所以下一步是如何把文字提取出来,经过分析,文字颜色在滤波后相对来说比较深,一把阈值化就可以了。
至此,已有识别模型就可以识别了。
这篇关于杂色背景验证码预处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!