【书法字识别】基于matlab余弦形状相似度书法字识别【含Matlab源码 1356期】

2024-04-11 05:58

本文主要是介绍【书法字识别】基于matlab余弦形状相似度书法字识别【含Matlab源码 1356期】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

✅博主简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,Matlab项目合作可私信。
🍎个人主页:海神之光
🏆代码获取方式:
海神之光Matlab王者学习之路—代码获取方式
⛳️座右铭:行百里者,半于九十。

更多Matlab仿真内容点击👇
Matlab图像处理(进阶版)
路径规划(Matlab)
神经网络预测与分类(Matlab)
优化求解(Matlab)
语音处理(Matlab)
信号处理(Matlab)
车间调度(Matlab)

⛄一、余弦形状相似度书法字识别简介

1 实验原理
以下理论来自于《根据形状相似性的书法内容检索》(中图分类号TP39)
1.1 轮廓点的形状属性
只判断轮廓的特征信息较判断所有像素信息计算量少,因此统计轮廓点。
对于轮廓上的像素点p,以其为中心做极坐标系,以r = 4、r = 8、r = 16 、r = 32和每个区间pi/4的角度,将周围区域分为32个区域,类似雷达,如图。
通过统计各区域内的轮廓点数,获得一个32*1的矩阵,这就是该像素的形状属性。区域越靠外r越大,因为越远的点,对于两图中匹配点选取的其重要性越低。
在这里插入图片描述

1.2 轮廓点的匹配度
对于样本字m中的某一点mi,其对待匹配字n中的某一个点nj的匹配度Cij由下式确定,其中w为形状属性中的分量。
如果满足前提条件:(某点的匹配点有一定绝对范围,不会出现从一个角落到另一个角落的情况)
在这里插入图片描述
则可以计算两点的相似度:
在这里插入图片描述
因为匹配度C一定存在一个最小值,其对应的n中的像素就是m所对应的最佳匹配点。
在这里插入图片描述
在两字完全相同的情况下,每一点的最小匹配度PMC都为0;
1.3 单字的匹配度
计算样本字中各个点对相应点的匹配度之和加上与对应点的欧氏距离之和(乘上a,经验系数),匹配度越高该值越低,通过对该值排序可得形状相似度的排序。
在这里插入图片描述
2 预处理
Batch 批处理函数
通过Uigetdir用户窗口获取数据集的地址(点击“数据集”作为根目录)。并通过字符串连接为*.gif为结尾,以此,可用dir读取数据集中所有(可选择kai楷书cao草书界定二级目录从而只读取其中一种字体)gif的文件信息存为im_path_list.,使用该结构中的name与folder获取图片具体地址,imread读入图像,存在元胞数组set中。
输出:
1.将图片通过im2bw转为二值图像(graythresh自动获取灰度阈值)存在set的第1行。
2.将文件名存在set的第6行。

data_read 函数:读取文件以及获取轮廓特征属性并存储。
(1)将set中图像缩放为32*32的二值图像,去除一些不必要信息以及减少运算量。(但可能会造成重要细节丢失,降低查准率)存储为第1行
(2)catch_shape 函数通过判断像素与周围像素的差值(上下左右只要有一个方向差为1即为轮廓点),获取轮廓信息,存在第2行。
(3)character函数计算轮廓的属性值,存在第4行。
(4)第3行存储该字的属性矩阵长度。
在这里插入图片描述
3 样本读取、检索
run_test 测试函数:
载入预处理后的数据集,ui界面获取test样本文件,按照预处理的方法处理之。
用compare_c依次计算test对于数据集中每一个字的匹配度(公式见前),返回匹配度与其坐标。
对各点匹配度进行升序排序,返回[B L]排序结果以及标签。

用户输入参数num threshold trial
由于对于不同样本字,其对数据集的匹配度序列不一样,且难以找到一个算法得到满意的匹配度的阈值,使得展示的字中查准率和查全率的组合比较理想,所以本次实验采用用户输入所需最大展示字数、搜索区间、尝试次数来确定展示的字。
Num:最大展示字数,暂时设定窗口是6*6个图形的空间,因此num不能大于35(第一个位置展示样本)
Threshold:由于相似度算法一定能够找到匹配度最高的一个字,若样本在数据集中选取,则该算法能保证一定就是原图。而数据集的读入具有顺序,所以在原图前后寻找匹配字则可以找到与原图相同的字。(草书和楷书交错存储)(如果不需要则可将threshold设为一个大数)一般设定为数据集中该字的数目
Trial:尝试次数,代表了在排序后的匹配值序列中的前trial个字中,寻找满足threshold设定区间的字。一般要设定相对较大。

实验结果与分析:
通过设定检索区间,以匹配度最高的为基准在周围进行检索,保证了查准率,而查全率可以通过提高尝试次数来提高:
若不设定检索区间,匹配度排序确定的序列中,前n个字有m个是正确字,应该匹配到的总字数是a,则查全率为m/a,查准率为m/n。
设定检索区间,将范围缩小到范围为2*threshold的区间,跳过了序列前部存储位置差距巨大的字,而存储时草书文件夹和楷书文件夹互相交错,很大程度上减少了错字的发现。因此要提高查全率只需提高trial,即在序列的前trial个字中搜索。
此方法的弊端是:若匹配度最高的字为错字,则之后所查全为错字。
本次检索,目的是在楷书中检索楷书,在草书中检索草书,但由于形状匹配也会造成草书和楷书的匹配,所以会出现混杂。若需要混合检索,只需调高threshold即可。
总之,本文提供了一个用户自定义参数来检索相似书法字的MATLAB程序,用户使用上包括ui界面批处理数据,ui界面读取测试图,输出匹配图案以及名称等功能。
内部实现了图像归一化处理、形状属性提取、图像匹配的功能。
理论来源为:《根据形状相似性的书法内容检索》(中图分类号TP39)《计算机辅助设计与图形学学报》第17卷 第11期

⛄二、部分源代码

clear all;
close all;
clc;
l = load(‘Processed.mat’);
set = l.set;
test = get_test;
tmp = zeros(length(set),1);
for n = 1:length(set)
[min,min_cor] =compare_c(test{2,1},set{2,n},test{4,1},set{4,n});
dis = 0;
for m = 1:length(test{2,1})
dis = dis+(norm(test{2,1}(m,:)-min_cor(m,:)))^2;
end
alpha = 0.1;
tmp(n,1) = sum(min)+alpha*dis;

end
[B,L] = sort(tmp);

num = input(‘type in num:’);
threshold = input(‘type in threshold:’);
trial = input(‘type in try times:’);
subplot(6,6,1)
imshow(test{5,1});

j =2;
for i = 1:trial
if j<=num
if abs(L(i)-L(1))<threshold %在检索区间内才展示
subplot(5,6,j);

    imshow(set{5,L(i)});title(set{6,L(i)});j = j+1;end
end

end
function [a] = my_area(i,j,S)
dx = S(j,1)-S(i,1);
dy = S(j,2)-S(i,2);
distance = sqrt(dx2+dy2);
co = dx/distance;
si = dy/distance;
ang2 = acos(co);
ang1 = asin(si);
a = 1;
if( ang1>=0 && ang1<pi/4 && ang2>=0 && ang2<pi/4)%1
if(distance>=2&&distance<=4)
a = 1;end
if(distance>=4&&distance<=8)
a = 2;end
if(distance>=8&&distance<=16)
a = 3;end
if(distance>=16&&distance<=32)
a = 4;end
end
if( ang1>=pi/4 && ang1<pi/2 && ang2>=pi/4 && ang2<pi/2)%2
if(distance>=2&&distance<=4)
a = 5;end
if(distance>=4&&distance<=8)
a = 6;end
if(distance>=8&&distance<=16)
a = 7;end
if(distance>=16&&distance<=32)
a = 8;end
end
if( ang1>=pi/4 && ang1<=pi/2 && ang2>=pi/2 && ang2<=pi0.75)%3
if(distance>=2&&distance<=4)
a = 9;end
if(distance>=4&&distance<=8)
a = 10;end
if(distance>=8&&distance<=16)
a = 11;end
if(distance>=16&&distance<=32)
a = 12;end
end
if( ang1>=0 && ang1<pi/4 && ang2>0.75
pi && ang2<=pi)%4
if(distance>=2&&distance<=4)
a = 13;end
if(distance>=4&&distance<=8)
a = 14;end
if(distance>=8&&distance<=16)
a = 15;end
if(distance>=16&&distance<=32)
a = 16;end
end
if( ang1>=-pi/4 && ang1<0 && ang2>=0.75pi && ang2<pi)%5
if(distance>=2&&distance<=4)
a = 17;end
if(distance>=4&&distance<=8)
a = 18;end
if(distance>=8&&distance<=16)
a = 19;end
if(distance>=16&&distance<=32)
a = 20;end
end
if( ang1>=-pi/2 && ang1<-pi/4 && ang2>= pi/2&& ang2<pi
0.75)%6
if(distance>=2&&distance<=4)
a = 21;end
if(distance>=4&&distance<=8)
a = 22;end
if(distance>=8&&distance<=16)
a = 23;end
if(distance>=16&&distance<=32)
a = 24;end
end
if( ang1>-pi/2 && ang1<=-pi/4 && ang2>= pi/4&& ang2<pi/2)%7
if(distance>=2&&distance<=4)
a = 25;end
if(distance>=4&&distance<=8)
a = 26;end
if(distance>=8&&distance<=16)
a = 27;end
if(distance>=16&&distance<=32)
a = 28;end
end
if( ang1>-pi/4 && ang1<=0 && ang2>= 0&& ang2<pi/4)%8
if(distance>=2&&distance<=4)
a = 29;end
if(distance>=4&&distance<=8)
a = 30;end
if(distance>=8&&distance<=16)
a = 31;end
if(distance>=16&&distance<=32)
a = 32;end
end
function adjust_try(num,thresh,trial,L)
j =2;
for i = 1:trial
if j< num
if abs(L(i)-L(1))<thresh
subplot(5,6,j);
imshow(set{5,L(i)});
j = j+1;
end
end
end

⛄三、运行结果

在这里插入图片描述

⛄四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1] 蔡利梅.MATLAB图像处理——理论、算法与实例分析[M].清华大学出版社,2020.
[2]杨丹,赵海滨,龙哲.MATLAB图像处理实例详解[M].清华大学出版社,2013.
[3]周品.MATLAB图像处理与图形用户界面设计[M].清华大学出版社,2013.
[4]刘成龙.精通MATLAB图像处理[M].清华大学出版社,2015.

3 备注
简介此部分摘自互联网,仅供参考,若侵权,联系删除

🍅 仿真咨询
1 各类智能优化算法改进及应用

生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化

2 机器学习和深度学习方面
卷积神经网络(CNN)、LSTM、支持向量机(SVM)、最小二乘支持向量机(LSSVM)、极限学习机(ELM)、核极限学习机(KELM)、BP、RBF、宽度学习、DBN、RF、RBF、DELM、XGBOOST、TCN实现风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断

3 图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知

4 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、车辆协同无人机路径规划、天线线性阵列分布优化、车间布局优化

5 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配

6 无线传感器定位及布局方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化

7 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化

8 电力系统方面
微电网优化、无功优化、配电网重构、储能配置

9 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长

10 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合

这篇关于【书法字识别】基于matlab余弦形状相似度书法字识别【含Matlab源码 1356期】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/893251

相关文章

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测 目录 时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测基本介绍程序设计参考资料 基本介绍 MATLAB实现LSTM时间序列未来多步预测-递归预测。LSTM是一种含有LSTM区块(blocks)或其他的一种类神经网络,文献或其他资料中LSTM区块可能被描述成智能网络单元,因为

springboot家政服务管理平台 LW +PPT+源码+讲解

3系统的可行性研究及需求分析 3.1可行性研究 3.1.1技术可行性分析 经过大学四年的学习,已经掌握了JAVA、Mysql数据库等方面的编程技巧和方法,对于这些技术该有的软硬件配置也是齐全的,能够满足开发的需要。 本家政服务管理平台采用的是Mysql作为数据库,可以绝对地保证用户数据的安全;可以与Mysql数据库进行无缝连接。 所以,家政服务管理平台在技术上是可以实施的。 3.1

高仿精仿愤怒的小鸟android版游戏源码

这是一款很完美的高仿精仿愤怒的小鸟android版游戏源码,大家可以研究一下吧、 为了报复偷走鸟蛋的肥猪们,鸟儿以自己的身体为武器,仿佛炮弹一样去攻击肥猪们的堡垒。游戏是十分卡通的2D画面,看着愤怒的红色小鸟,奋不顾身的往绿色的肥猪的堡垒砸去,那种奇妙的感觉还真是令人感到很欢乐。而游戏的配乐同样充满了欢乐的感觉,轻松的节奏,欢快的风格。 源码下载

基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别

转发来源:https://swift.ctolib.com/ooooverflow-chinese-ocr.html chinese-ocr 基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别 环境部署 sh setup.sh 使用环境: python 3.6 + tensorflow 1.10 +pytorch 0.4.1 注:CPU环境

百度OCR识别结构结构化处理视频

https://edu.csdn.net/course/detail/10506

基于Java医院药品交易系统详细设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝10W+,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码+数据库🌟 感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人  Java精品实战案例《600套》 2023-2025年最值得选择的Java毕业设计选题大全:1000个热

Pycharm配置conda环境(解决新版本无法识别可执行文件问题)

引言: 很多小伙伴在下载最新版本的pycharm或者更新到最新版本后为项目配置conda环境的时候,发现文件夹目录中无法显示可执行文件(一般为python.exe),以下就是本人遇到该问题后试验和解决该问题的一些方法和思路。 一般遇到该问题的人群有两种,一种是刚入门对pycharm进行conda环境配置的小白(例如我),不熟悉相关环境配置的操作和过程,还有一种是入坑pycharm有段时间的老手

美容美发店营销版微信小程序源码

打造线上生意新篇章 一、引言:微信小程序,开启美容美发行业新纪元 在数字化时代,微信小程序以其便捷、高效的特点,成为了美容美发行业营销的新宠。本文将带您深入了解美容美发营销微信小程序,探讨其独特优势及如何助力商家实现业务增长。 二、微信小程序:美容美发行业的得力助手 拓宽客源渠道:微信小程序基于微信社交平台,轻松实现线上线下融合,帮助商家快速吸引潜在客户,拓宽客源渠道。 提升用户体验:

风水研究会官网源码系统-可展示自己的领域内容-商品售卖等

一款用于展示风水行业,周易测算行业,玄学行业的系统,并支持售卖自己的商品。 整洁大气,非常漂亮,前端内容均可通过后台修改。 大致功能: 支持前端内容通过后端自定义支持开启关闭会员功能,会员等级设置支持对接官方支付支持添加商品类支持添加虚拟下载类支持自定义其他类型字段支持生成虚拟激活卡支持采集其他站点文章支持对接收益广告支持文章评论支持积分功能支持推广功能更多功能,搭建完成自行体验吧! 原文

神经网络第四篇:推理处理之手写数字识别

到目前为止,我们已经介绍完了神经网络的基本结构,现在用一个图像识别示例对前面的知识作整体的总结。本专题知识点如下: MNIST数据集图像数据转图像神经网络的推理处理批处理  MNIST数据集          mnist数据图像 MNIST数据集由0到9的数字图像构成。像素取值在0到255之间。每个图像数据都相应地标有“7”、“2”、“1”等数字标签。MNIST数据集中,