【书法字识别】基于matlab余弦形状相似度书法字识别【含Matlab源码 1356期】

2024-04-11 05:58

本文主要是介绍【书法字识别】基于matlab余弦形状相似度书法字识别【含Matlab源码 1356期】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

✅博主简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,Matlab项目合作可私信。
🍎个人主页:海神之光
🏆代码获取方式:
海神之光Matlab王者学习之路—代码获取方式
⛳️座右铭:行百里者,半于九十。

更多Matlab仿真内容点击👇
Matlab图像处理(进阶版)
路径规划(Matlab)
神经网络预测与分类(Matlab)
优化求解(Matlab)
语音处理(Matlab)
信号处理(Matlab)
车间调度(Matlab)

⛄一、余弦形状相似度书法字识别简介

1 实验原理
以下理论来自于《根据形状相似性的书法内容检索》(中图分类号TP39)
1.1 轮廓点的形状属性
只判断轮廓的特征信息较判断所有像素信息计算量少,因此统计轮廓点。
对于轮廓上的像素点p,以其为中心做极坐标系,以r = 4、r = 8、r = 16 、r = 32和每个区间pi/4的角度,将周围区域分为32个区域,类似雷达,如图。
通过统计各区域内的轮廓点数,获得一个32*1的矩阵,这就是该像素的形状属性。区域越靠外r越大,因为越远的点,对于两图中匹配点选取的其重要性越低。
在这里插入图片描述

1.2 轮廓点的匹配度
对于样本字m中的某一点mi,其对待匹配字n中的某一个点nj的匹配度Cij由下式确定,其中w为形状属性中的分量。
如果满足前提条件:(某点的匹配点有一定绝对范围,不会出现从一个角落到另一个角落的情况)
在这里插入图片描述
则可以计算两点的相似度:
在这里插入图片描述
因为匹配度C一定存在一个最小值,其对应的n中的像素就是m所对应的最佳匹配点。
在这里插入图片描述
在两字完全相同的情况下,每一点的最小匹配度PMC都为0;
1.3 单字的匹配度
计算样本字中各个点对相应点的匹配度之和加上与对应点的欧氏距离之和(乘上a,经验系数),匹配度越高该值越低,通过对该值排序可得形状相似度的排序。
在这里插入图片描述
2 预处理
Batch 批处理函数
通过Uigetdir用户窗口获取数据集的地址(点击“数据集”作为根目录)。并通过字符串连接为*.gif为结尾,以此,可用dir读取数据集中所有(可选择kai楷书cao草书界定二级目录从而只读取其中一种字体)gif的文件信息存为im_path_list.,使用该结构中的name与folder获取图片具体地址,imread读入图像,存在元胞数组set中。
输出:
1.将图片通过im2bw转为二值图像(graythresh自动获取灰度阈值)存在set的第1行。
2.将文件名存在set的第6行。

data_read 函数:读取文件以及获取轮廓特征属性并存储。
(1)将set中图像缩放为32*32的二值图像,去除一些不必要信息以及减少运算量。(但可能会造成重要细节丢失,降低查准率)存储为第1行
(2)catch_shape 函数通过判断像素与周围像素的差值(上下左右只要有一个方向差为1即为轮廓点),获取轮廓信息,存在第2行。
(3)character函数计算轮廓的属性值,存在第4行。
(4)第3行存储该字的属性矩阵长度。
在这里插入图片描述
3 样本读取、检索
run_test 测试函数:
载入预处理后的数据集,ui界面获取test样本文件,按照预处理的方法处理之。
用compare_c依次计算test对于数据集中每一个字的匹配度(公式见前),返回匹配度与其坐标。
对各点匹配度进行升序排序,返回[B L]排序结果以及标签。

用户输入参数num threshold trial
由于对于不同样本字,其对数据集的匹配度序列不一样,且难以找到一个算法得到满意的匹配度的阈值,使得展示的字中查准率和查全率的组合比较理想,所以本次实验采用用户输入所需最大展示字数、搜索区间、尝试次数来确定展示的字。
Num:最大展示字数,暂时设定窗口是6*6个图形的空间,因此num不能大于35(第一个位置展示样本)
Threshold:由于相似度算法一定能够找到匹配度最高的一个字,若样本在数据集中选取,则该算法能保证一定就是原图。而数据集的读入具有顺序,所以在原图前后寻找匹配字则可以找到与原图相同的字。(草书和楷书交错存储)(如果不需要则可将threshold设为一个大数)一般设定为数据集中该字的数目
Trial:尝试次数,代表了在排序后的匹配值序列中的前trial个字中,寻找满足threshold设定区间的字。一般要设定相对较大。

实验结果与分析:
通过设定检索区间,以匹配度最高的为基准在周围进行检索,保证了查准率,而查全率可以通过提高尝试次数来提高:
若不设定检索区间,匹配度排序确定的序列中,前n个字有m个是正确字,应该匹配到的总字数是a,则查全率为m/a,查准率为m/n。
设定检索区间,将范围缩小到范围为2*threshold的区间,跳过了序列前部存储位置差距巨大的字,而存储时草书文件夹和楷书文件夹互相交错,很大程度上减少了错字的发现。因此要提高查全率只需提高trial,即在序列的前trial个字中搜索。
此方法的弊端是:若匹配度最高的字为错字,则之后所查全为错字。
本次检索,目的是在楷书中检索楷书,在草书中检索草书,但由于形状匹配也会造成草书和楷书的匹配,所以会出现混杂。若需要混合检索,只需调高threshold即可。
总之,本文提供了一个用户自定义参数来检索相似书法字的MATLAB程序,用户使用上包括ui界面批处理数据,ui界面读取测试图,输出匹配图案以及名称等功能。
内部实现了图像归一化处理、形状属性提取、图像匹配的功能。
理论来源为:《根据形状相似性的书法内容检索》(中图分类号TP39)《计算机辅助设计与图形学学报》第17卷 第11期

⛄二、部分源代码

clear all;
close all;
clc;
l = load(‘Processed.mat’);
set = l.set;
test = get_test;
tmp = zeros(length(set),1);
for n = 1:length(set)
[min,min_cor] =compare_c(test{2,1},set{2,n},test{4,1},set{4,n});
dis = 0;
for m = 1:length(test{2,1})
dis = dis+(norm(test{2,1}(m,:)-min_cor(m,:)))^2;
end
alpha = 0.1;
tmp(n,1) = sum(min)+alpha*dis;

end
[B,L] = sort(tmp);

num = input(‘type in num:’);
threshold = input(‘type in threshold:’);
trial = input(‘type in try times:’);
subplot(6,6,1)
imshow(test{5,1});

j =2;
for i = 1:trial
if j<=num
if abs(L(i)-L(1))<threshold %在检索区间内才展示
subplot(5,6,j);

    imshow(set{5,L(i)});title(set{6,L(i)});j = j+1;end
end

end
function [a] = my_area(i,j,S)
dx = S(j,1)-S(i,1);
dy = S(j,2)-S(i,2);
distance = sqrt(dx2+dy2);
co = dx/distance;
si = dy/distance;
ang2 = acos(co);
ang1 = asin(si);
a = 1;
if( ang1>=0 && ang1<pi/4 && ang2>=0 && ang2<pi/4)%1
if(distance>=2&&distance<=4)
a = 1;end
if(distance>=4&&distance<=8)
a = 2;end
if(distance>=8&&distance<=16)
a = 3;end
if(distance>=16&&distance<=32)
a = 4;end
end
if( ang1>=pi/4 && ang1<pi/2 && ang2>=pi/4 && ang2<pi/2)%2
if(distance>=2&&distance<=4)
a = 5;end
if(distance>=4&&distance<=8)
a = 6;end
if(distance>=8&&distance<=16)
a = 7;end
if(distance>=16&&distance<=32)
a = 8;end
end
if( ang1>=pi/4 && ang1<=pi/2 && ang2>=pi/2 && ang2<=pi0.75)%3
if(distance>=2&&distance<=4)
a = 9;end
if(distance>=4&&distance<=8)
a = 10;end
if(distance>=8&&distance<=16)
a = 11;end
if(distance>=16&&distance<=32)
a = 12;end
end
if( ang1>=0 && ang1<pi/4 && ang2>0.75
pi && ang2<=pi)%4
if(distance>=2&&distance<=4)
a = 13;end
if(distance>=4&&distance<=8)
a = 14;end
if(distance>=8&&distance<=16)
a = 15;end
if(distance>=16&&distance<=32)
a = 16;end
end
if( ang1>=-pi/4 && ang1<0 && ang2>=0.75pi && ang2<pi)%5
if(distance>=2&&distance<=4)
a = 17;end
if(distance>=4&&distance<=8)
a = 18;end
if(distance>=8&&distance<=16)
a = 19;end
if(distance>=16&&distance<=32)
a = 20;end
end
if( ang1>=-pi/2 && ang1<-pi/4 && ang2>= pi/2&& ang2<pi
0.75)%6
if(distance>=2&&distance<=4)
a = 21;end
if(distance>=4&&distance<=8)
a = 22;end
if(distance>=8&&distance<=16)
a = 23;end
if(distance>=16&&distance<=32)
a = 24;end
end
if( ang1>-pi/2 && ang1<=-pi/4 && ang2>= pi/4&& ang2<pi/2)%7
if(distance>=2&&distance<=4)
a = 25;end
if(distance>=4&&distance<=8)
a = 26;end
if(distance>=8&&distance<=16)
a = 27;end
if(distance>=16&&distance<=32)
a = 28;end
end
if( ang1>-pi/4 && ang1<=0 && ang2>= 0&& ang2<pi/4)%8
if(distance>=2&&distance<=4)
a = 29;end
if(distance>=4&&distance<=8)
a = 30;end
if(distance>=8&&distance<=16)
a = 31;end
if(distance>=16&&distance<=32)
a = 32;end
end
function adjust_try(num,thresh,trial,L)
j =2;
for i = 1:trial
if j< num
if abs(L(i)-L(1))<thresh
subplot(5,6,j);
imshow(set{5,L(i)});
j = j+1;
end
end
end

⛄三、运行结果

在这里插入图片描述

⛄四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1] 蔡利梅.MATLAB图像处理——理论、算法与实例分析[M].清华大学出版社,2020.
[2]杨丹,赵海滨,龙哲.MATLAB图像处理实例详解[M].清华大学出版社,2013.
[3]周品.MATLAB图像处理与图形用户界面设计[M].清华大学出版社,2013.
[4]刘成龙.精通MATLAB图像处理[M].清华大学出版社,2015.

3 备注
简介此部分摘自互联网,仅供参考,若侵权,联系删除

🍅 仿真咨询
1 各类智能优化算法改进及应用

生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化

2 机器学习和深度学习方面
卷积神经网络(CNN)、LSTM、支持向量机(SVM)、最小二乘支持向量机(LSSVM)、极限学习机(ELM)、核极限学习机(KELM)、BP、RBF、宽度学习、DBN、RF、RBF、DELM、XGBOOST、TCN实现风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断

3 图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知

4 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、车辆协同无人机路径规划、天线线性阵列分布优化、车间布局优化

5 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配

6 无线传感器定位及布局方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化

7 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化

8 电力系统方面
微电网优化、无功优化、配电网重构、储能配置

9 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长

10 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合

这篇关于【书法字识别】基于matlab余弦形状相似度书法字识别【含Matlab源码 1356期】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/893251

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟&nbsp;开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚&nbsp;第一站:海量资源,应有尽有 走进“智听

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

Java ArrayList扩容机制 (源码解读)

结论:初始长度为10,若所需长度小于1.5倍原长度,则按照1.5倍扩容。若不够用则按照所需长度扩容。 一. 明确类内部重要变量含义         1:数组默认长度         2:这是一个共享的空数组实例,用于明确创建长度为0时的ArrayList ,比如通过 new ArrayList<>(0),ArrayList 内部的数组 elementData 会指向这个 EMPTY_EL

如何在Visual Studio中调试.NET源码

今天偶然在看别人代码时,发现在他的代码里使用了Any判断List<T>是否为空。 我一般的做法是先判断是否为null,再判断Count。 看了一下Count的源码如下: 1 [__DynamicallyInvokable]2 public int Count3 {4 [__DynamicallyInvokable]5 get

工厂ERP管理系统实现源码(JAVA)

工厂进销存管理系统是一个集采购管理、仓库管理、生产管理和销售管理于一体的综合解决方案。该系统旨在帮助企业优化流程、提高效率、降低成本,并实时掌握各环节的运营状况。 在采购管理方面,系统能够处理采购订单、供应商管理和采购入库等流程,确保采购过程的透明和高效。仓库管理方面,实现库存的精准管理,包括入库、出库、盘点等操作,确保库存数据的准确性和实时性。 生产管理模块则涵盖了生产计划制定、物料需求计划、

Spring 源码解读:自定义实现Bean定义的注册与解析

引言 在Spring框架中,Bean的注册与解析是整个依赖注入流程的核心步骤。通过Bean定义,Spring容器知道如何创建、配置和管理每个Bean实例。本篇文章将通过实现一个简化版的Bean定义注册与解析机制,帮助你理解Spring框架背后的设计逻辑。我们还将对比Spring中的BeanDefinition和BeanDefinitionRegistry,以全面掌握Bean注册和解析的核心原理。

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以打印WAV音频文件每个packet(也称为数据包或多媒体包)的信息,这些信息包含该packet的pts、dts: 打印出来的“pts”实际是AVPacket结构体中的成员变量pts,是以AVStream->time_base为单位的显

kubelet组件的启动流程源码分析

概述 摘要: 本文将总结kubelet的作用以及原理,在有一定基础认识的前提下,通过阅读kubelet源码,对kubelet组件的启动流程进行分析。 正文 kubelet的作用 这里对kubelet的作用做一个简单总结。 节点管理 节点的注册 节点状态更新 容器管理(pod生命周期管理) 监听apiserver的容器事件 容器的创建、删除(CRI) 容器的网络的创建与删除

matlab读取NC文件(含group)

matlab读取NC文件(含group): NC文件数据结构: 代码: % 打开 NetCDF 文件filename = 'your_file.nc'; % 替换为你的文件名% 使用 netcdf.open 函数打开文件ncid = netcdf.open(filename, 'NC_NOWRITE');% 查看文件中的组% 假设我们想读取名为 "group1" 的组groupName

利用matlab bar函数绘制较为复杂的柱状图,并在图中进行适当标注

示例代码和结果如下:小疑问:如何自动选择合适的坐标位置对柱状图的数值大小进行标注?😂 clear; close all;x = 1:3;aa=[28.6321521955954 26.2453660695847 21.69102348512086.93747104431360 6.25442246899816 3.342835958564245.51365061796319 4.87