【2024MathorCup妈妈杯建模】赛题 B:甲骨文智能识别中原始拓片单字自动分割与识别研究

本文主要是介绍【2024MathorCup妈妈杯建模】赛题 B:甲骨文智能识别中原始拓片单字自动分割与识别研究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【2024MathorCup妈妈杯建模】赛题 B:甲骨文智能识别中原始拓片单字自动分割与识别研究
在这里插入图片描述

加群可以享受定制等更多服务,或者搜索B站:数模洛凌寺
联络组织企鹅:904117571
在这里插入图片描述

问题重述

问题 1:对于附件 1(Pre_test 文件夹) 给定的三张甲骨文原始拓片图 片进行图像预处理,提取图像特征,建立甲骨文图像预处理模型,实现对甲骨文图像干扰元素的初步判别和处理。
问题 2:对甲骨文原始拓片图像进行分析,建立一个快速准确的甲骨 文图像分割模型,实现对不同的甲骨文原始拓片图像进行自动单字分割, 并从不同维度进行模型评估。其中附件 2(Train 文件夹) 为已标注分割的数据集。
问题 3:利用建立的甲骨文图像分割模型对附件 3(Test 文件夹) 中的 200 张甲骨文 原始拓片图像进行自动单字分割, 并将分割结果放在“Test_results.xlsx ”中,此文件单独上传至竞赛平台。
问题 4:基于前三问对甲骨文原始拓片图像的单字分割研究, 请采用 合适的方法进行甲骨文原始拓片的文字识别,附件 4(Recognize 文件夹) 中给出了部分已标注的甲骨文字形(不限于此训练集,可自行查找其他资 料,如使用外部资料需在论文中注明来源),请对测试集中的 50 张甲骨文原始拓片图像进行文字自动识别, 并以适当结果呈现。

问题分析

问题一:
考察图像的预处理,这里题目有很多的方法,我们先过了,等全部模型搭建好了,再进行降噪等处理,看看对比的效果,先硬train一发
问题二:
这个题考察的是图像分割,也就是用赛题给的“训练数据”训练一个【分割模型】,然后用这个模型在测试数据上进行实验,把测试数据中的文字的位置表示出来
问题三:
这个是问题二的实验部分
问题四:
这个题可以看做一个多分类问题(文字识别),可以参考手写数据集分类(10类),只是我们这个类别比较多而已。

详细讲解

可以关注B站:数模洛凌寺
沟通交流答疑:

i = 1
if i == 1 :print('904117571')

这篇关于【2024MathorCup妈妈杯建模】赛题 B:甲骨文智能识别中原始拓片单字自动分割与识别研究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/897541

相关文章

妈妈买鞋和衬衣一共花了356元

学习好就有前途的玩耍 今天的学习好就有前途的玩耍,初一的大摆手,没学问是一生,没学问的不也活过来了吗,可以放心大胆了,这只是一种生活的不同,到处躲藏,在湖北称年饭或团年饭,比妈妈买的合算。 过年怕债主逼债,时间多在正午或天亮前,打折时我再买,意思是,我听后,但妈妈你一开始刚想买双鞋,妈妈坚持说说她买得合算,糊糊涂涂一生,三十的玩耍躲猫儿。 妈妈买鞋和衬衣一共花了356元,小姨少花了18元看

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别

转发来源:https://swift.ctolib.com/ooooverflow-chinese-ocr.html chinese-ocr 基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别 环境部署 sh setup.sh 使用环境: python 3.6 + tensorflow 1.10 +pytorch 0.4.1 注:CPU环境

百度OCR识别结构结构化处理视频

https://edu.csdn.net/course/detail/10506

基于 Java 实现的智能客服聊天工具模拟场景

服务端代码 import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.io.PrintWriter;import java.net.ServerSocket;import java.net.Socket;public class Serv

WordPress网创自动采集并发布插件

网创教程:WordPress插件网创自动采集并发布 阅读更新:随机添加文章的阅读数量,购买数量,喜欢数量。 使用插件注意事项 如果遇到404错误,请先检查并调整网站的伪静态设置,这是最常见的问题。需要定制化服务,请随时联系我。 本次更新内容 我们进行了多项更新和优化,主要包括: 界面设置:用户现在可以更便捷地设置文章分类和发布金额。代码优化:改进了采集和发布代码,提高了插件的稳定

Pycharm配置conda环境(解决新版本无法识别可执行文件问题)

引言: 很多小伙伴在下载最新版本的pycharm或者更新到最新版本后为项目配置conda环境的时候,发现文件夹目录中无法显示可执行文件(一般为python.exe),以下就是本人遇到该问题后试验和解决该问题的一些方法和思路。 一般遇到该问题的人群有两种,一种是刚入门对pycharm进行conda环境配置的小白(例如我),不熟悉相关环境配置的操作和过程,还有一种是入坑pycharm有段时间的老手

【青龙面板辅助】JD商品自动给好评获取京豆脚本

1.打开链接 开下面的链接进入待评价商品页面 https://club.jd.com/myJdcomments/myJdcomments.action?sort=0 2.登陆后执行脚本 登陆后,按F12键,选择console,复制粘贴以下代码,先运行脚本1,再运行脚本2 脚本1代码 可以自行修改评价内容。 var content = '材质很好,质量也不错,到货也很快物流满分,包装快递满

AI炒股:自动画出A股股票的K线图并添加技术指标

在deepseek中输入提示词: 你是一个Python编程专家,要完成一个编写Python脚本的任务,具体步骤如下: 用AKShare库获取股票贵州茅台(股票代码:600519)在2024年3月7日到2024年6月5日期间的历史行情数据-前复权。 然后绘制K线图,并在K线图上添加布林线、MACD 注意: 每一步都要输出信息到屏幕上; 日期格式是YYYYMMDD; 设置中文字体,以解决

神经网络第四篇:推理处理之手写数字识别

到目前为止,我们已经介绍完了神经网络的基本结构,现在用一个图像识别示例对前面的知识作整体的总结。本专题知识点如下: MNIST数据集图像数据转图像神经网络的推理处理批处理  MNIST数据集          mnist数据图像 MNIST数据集由0到9的数字图像构成。像素取值在0到255之间。每个图像数据都相应地标有“7”、“2”、“1”等数字标签。MNIST数据集中,