本文主要是介绍【数据应用案例】通过字体识别国籍,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
案例来源:@量子位
案例地址:https://mp.weixin.qq.com/s/m8IQNuCZUCHUUzw1OZEJpg
1. 目标:基于字体,识别国籍(中国、印度、马来西亚、孟加拉国、伊朗五个国家)
2. 数据预处理
1)处理文本图像中的噪点
2)抽取行文本图像
2. 特征工程
1)字母间距离
2)Cloud of Line Distribution软件抽取的笔画特征
a. 线分布特征:垂直度和弯曲度
b. 描边特征
c. 笔记关键点特征
3)将各特征表征在极坐标,使用PCA进行降维
3. 分类器:SVM
4. 效果:75%的准确率,还有很大提升空间
这篇关于【数据应用案例】通过字体识别国籍的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!