Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻

本文主要是介绍Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

a7b5231f2660551397e5f242bb28f124.png

最近有不少伙伴在交流群和公众号里面询问公式识别的工具。毫无疑问,目前在公式识别领域遥遥领先于同行的Mathpix是最佳的选择,咱之前在公众号里分别推荐了ta的软件包(科研必备神器推荐之Mathpix公式识别提取)和Mathpix API的matlab版调用方法(公式识别神器Mathpix for matlab 1.0.0版正式发布)。前者若是普通邮箱,每月可以免费使用50次识别,若是教育网邮箱,则每月可以免费使用100次识别;若使用后者API调用方式,则每月可以免费使用1000次免费识别,当然需要有信用卡先注册相应的账号才能使用,过程虽说不复杂,但有的伙伴反馈注册验证过程中往往会出现掉链子的情况。

既然是如此复杂,何必这般操心呢?真正免费的、离线的ta用起来不香吗?其今天即将给伙伴分享的这个公式识别工具其实很久之前就在公众号铁粉专属交流群—科研学术交流群里给他们分享过。不过看大家对公式识别需求这么大,咱就把这个压箱底(当然咱的箱底里可不止这一款)的工具分享出来,当然不排除咱们的关注者中已经有人在使用了这款工具。

今天分享的这款公式识别神器是由大神Lukas-Blecher开发的,采用Python语言编写,在Github中获得2.7K stars和311次forks,从上线至今,平均每月有超过3500次下载,火爆程度杠杠的。

52f13065faf7eca51dca467a4d2dce73.png

a6277dbf7ffe0ef5643629f04cce8a55.png

LaTex OCR的识别技术路线如下:

e550a253b3d3c81a10a6702544e7fb5d.png

其中最方便的莫过于它添加了GUI界面,可以直接截图识别而无需使用命令行操作。

LaTex-OCR的运行环境要求Python的版本3.7+,并安装相应依赖文件,如PyTorch,详情见setup.py文件中。LaTex-OCR提供三种包:GUI、API和Train,以下是三种包的安装命令:

① pix2tex[gui] (界面版,在CMD中输入latexocr命令直接调出GUI使用),安装命令为:

pip install pix2tex[gui]

② pix2tex[api] (API形式,Streamlit和docker),安装命令为:

pip install -U pix2tex[api]

③ pix2tex[train] (训练模块,支持用户训练自己的公式数据库,增强模型的自我创新能力),安装命令为:

pip install pix2tex[train]

测试效果动画:

0c1a396b39166b2e529d0ff740996cab.gif

以上就是今天分享的全部内容,望伙伴用得愉快,使用中若遇到什么问题,欢迎留言或直接到Latex-OCR项目的issue区搜寻答案或提问。

祝伙伴们生活、工作愉快,有缘再见!!!

参考资料:github.com/lukas-blecher/LaTeX-OCR

如需转载,请在公众号中回复“转载”获取授权,如未经授权擅自搬运抄袭的,本公众号将保留一切追责权利!

这篇关于Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/663088

相关文章

用Microsoft.Extensions.Hosting 管理WPF项目.

首先引入必要的包: <ItemGroup><PackageReference Include="CommunityToolkit.Mvvm" Version="8.2.2" /><PackageReference Include="Microsoft.Extensions.Hosting" Version="8.0.0" /><PackageReference Include="Serilog

eclipse运行springboot项目,找不到主类

解决办法尝试了很多种,下载sts压缩包行不通。最后解决办法如图: help--->Eclipse Marketplace--->Popular--->找到Spring Tools 3---->Installed。

Lipowerline5.0 雷达电力应用软件下载使用

1.配网数据处理分析 针对配网线路点云数据,优化了分类算法,支持杆塔、导线、交跨线、建筑物、地面点和其他线路的自动分类;一键生成危险点报告和交跨报告;还能生成点云数据采集航线和自主巡检航线。 获取软件安装包联系邮箱:2895356150@qq.com,资源源于网络,本介绍用于学习使用,如有侵权请您联系删除! 2.新增快速版,简洁易上手 支持快速版和专业版切换使用,快速版界面简洁,保留主

Python 字符串占位

在Python中,可以使用字符串的格式化方法来实现字符串的占位。常见的方法有百分号操作符 % 以及 str.format() 方法 百分号操作符 % name = "张三"age = 20message = "我叫%s,今年%d岁。" % (name, age)print(message) # 我叫张三,今年20岁。 str.format() 方法 name = "张三"age

vue项目集成CanvasEditor实现Word在线编辑器

CanvasEditor实现Word在线编辑器 官网文档:https://hufe.club/canvas-editor-docs/guide/schema.html 源码地址:https://github.com/Hufe921/canvas-editor 前提声明: 由于CanvasEditor目前不支持vue、react 等框架开箱即用版,所以需要我们去Git下载源码,拿到其中两个主

React+TS前台项目实战(十七)-- 全局常用组件Dropdown封装

文章目录 前言Dropdown组件1. 功能分析2. 代码+详细注释3. 使用方式4. 效果展示 总结 前言 今天这篇主要讲全局Dropdown组件封装,可根据UI设计师要求自定义修改。 Dropdown组件 1. 功能分析 (1)通过position属性,可以控制下拉选项的位置 (2)通过传入width属性, 可以自定义下拉选项的宽度 (3)通过传入classN

Android多线程下载见解

通过for循环开启N个线程,这是多线程,但每次循环都new一个线程肯定很耗内存的。那可以改用线程池来。 就以我个人对多线程下载的理解是开启一个线程后: 1.通过HttpUrlConnection对象获取要下载文件的总长度 2.通过RandomAccessFile流对象在本地创建一个跟远程文件长度一样大小的空文件。 3.通过文件总长度/线程个数=得到每个线程大概要下载的量(线程块大小)。

一道经典Python程序样例带你飞速掌握Python的字典和列表

Python中的列表(list)和字典(dict)是两种常用的数据结构,它们在数据组织和存储方面有很大的不同。 列表(List) 列表是Python中的一种有序集合,可以随时添加和删除其中的元素。列表中的元素可以是任何数据类型,包括数字、字符串、其他列表等。列表使用方括号[]表示,元素之间用逗号,分隔。 定义和使用 # 定义一个列表 fruits = ['apple', 'banana

Python应用开发——30天学习Streamlit Python包进行APP的构建(9)

st.area_chart 显示区域图。 这是围绕 st.altair_chart 的语法糖。主要区别在于该命令使用数据自身的列和指数来计算图表的 Altair 规格。因此,在许多 "只需绘制此图 "的情况下,该命令更易于使用,但可定制性较差。 如果 st.area_chart 无法正确猜测数据规格,请尝试使用 st.altair_chart 指定所需的图表。 Function signa

python实现最简单循环神经网络(RNNs)

Recurrent Neural Networks(RNNs) 的模型: 上图中红色部分是输入向量。文本、单词、数据都是输入,在网络里都以向量的形式进行表示。 绿色部分是隐藏向量。是加工处理过程。 蓝色部分是输出向量。 python代码表示如下: rnn = RNN()y = rnn.step(x) # x为输入向量,y为输出向量 RNNs神经网络由神经元组成, python