Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻

本文主要是介绍Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

a7b5231f2660551397e5f242bb28f124.png

最近有不少伙伴在交流群和公众号里面询问公式识别的工具。毫无疑问,目前在公式识别领域遥遥领先于同行的Mathpix是最佳的选择,咱之前在公众号里分别推荐了ta的软件包(科研必备神器推荐之Mathpix公式识别提取)和Mathpix API的matlab版调用方法(公式识别神器Mathpix for matlab 1.0.0版正式发布)。前者若是普通邮箱,每月可以免费使用50次识别,若是教育网邮箱,则每月可以免费使用100次识别;若使用后者API调用方式,则每月可以免费使用1000次免费识别,当然需要有信用卡先注册相应的账号才能使用,过程虽说不复杂,但有的伙伴反馈注册验证过程中往往会出现掉链子的情况。

既然是如此复杂,何必这般操心呢?真正免费的、离线的ta用起来不香吗?其今天即将给伙伴分享的这个公式识别工具其实很久之前就在公众号铁粉专属交流群—科研学术交流群里给他们分享过。不过看大家对公式识别需求这么大,咱就把这个压箱底(当然咱的箱底里可不止这一款)的工具分享出来,当然不排除咱们的关注者中已经有人在使用了这款工具。

今天分享的这款公式识别神器是由大神Lukas-Blecher开发的,采用Python语言编写,在Github中获得2.7K stars和311次forks,从上线至今,平均每月有超过3500次下载,火爆程度杠杠的。

52f13065faf7eca51dca467a4d2dce73.png

a6277dbf7ffe0ef5643629f04cce8a55.png

LaTex OCR的识别技术路线如下:

e550a253b3d3c81a10a6702544e7fb5d.png

其中最方便的莫过于它添加了GUI界面,可以直接截图识别而无需使用命令行操作。

LaTex-OCR的运行环境要求Python的版本3.7+,并安装相应依赖文件,如PyTorch,详情见setup.py文件中。LaTex-OCR提供三种包:GUI、API和Train,以下是三种包的安装命令:

① pix2tex[gui] (界面版,在CMD中输入latexocr命令直接调出GUI使用),安装命令为:

pip install pix2tex[gui]

② pix2tex[api] (API形式,Streamlit和docker),安装命令为:

pip install -U pix2tex[api]

③ pix2tex[train] (训练模块,支持用户训练自己的公式数据库,增强模型的自我创新能力),安装命令为:

pip install pix2tex[train]

测试效果动画:

0c1a396b39166b2e529d0ff740996cab.gif

以上就是今天分享的全部内容,望伙伴用得愉快,使用中若遇到什么问题,欢迎留言或直接到Latex-OCR项目的issue区搜寻答案或提问。

祝伙伴们生活、工作愉快,有缘再见!!!

参考资料:github.com/lukas-blecher/LaTeX-OCR

如需转载,请在公众号中回复“转载”获取授权,如未经授权擅自搬运抄袭的,本公众号将保留一切追责权利!

这篇关于Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/663088

相关文章

Python实现特殊字符判断并去掉非字母和数字的特殊字符

《Python实现特殊字符判断并去掉非字母和数字的特殊字符》在Python中,可以通过多种方法来判断字符串中是否包含非字母、数字的特殊字符,并将这些特殊字符去掉,本文为大家整理了一些常用的,希望对大家... 目录1. 使用正则表达式判断字符串中是否包含特殊字符去掉字符串中的特殊字符2. 使用 str.isa

python中各种常见文件的读写操作与类型转换详细指南

《python中各种常见文件的读写操作与类型转换详细指南》这篇文章主要为大家详细介绍了python中各种常见文件(txt,xls,csv,sql,二进制文件)的读写操作与类型转换,感兴趣的小伙伴可以跟... 目录1.文件txt读写标准用法1.1写入文件1.2读取文件2. 二进制文件读取3. 大文件读取3.1

将Java项目提交到云服务器的流程步骤

《将Java项目提交到云服务器的流程步骤》所谓将项目提交到云服务器即将你的项目打成一个jar包然后提交到云服务器即可,因此我们需要准备服务器环境为:Linux+JDK+MariDB(MySQL)+Gi... 目录1. 安装 jdk1.1 查看 jdk 版本1.2 下载 jdk2. 安装 mariadb(my

使用Python实现一个优雅的异步定时器

《使用Python实现一个优雅的异步定时器》在Python中实现定时器功能是一个常见需求,尤其是在需要周期性执行任务的场景下,本文给大家介绍了基于asyncio和threading模块,可扩展的异步定... 目录需求背景代码1. 单例事件循环的实现2. 事件循环的运行与关闭3. 定时器核心逻辑4. 启动与停

基于Python实现读取嵌套压缩包下文件的方法

《基于Python实现读取嵌套压缩包下文件的方法》工作中遇到的问题,需要用Python实现嵌套压缩包下文件读取,本文给大家介绍了详细的解决方法,并有相关的代码示例供大家参考,需要的朋友可以参考下... 目录思路完整代码代码优化思路打开外层zip压缩包并遍历文件:使用with zipfile.ZipFil

Python处理函数调用超时的四种方法

《Python处理函数调用超时的四种方法》在实际开发过程中,我们可能会遇到一些场景,需要对函数的执行时间进行限制,例如,当一个函数执行时间过长时,可能会导致程序卡顿、资源占用过高,因此,在某些情况下,... 目录前言func-timeout1. 安装 func-timeout2. 基本用法自定义进程subp

Python实现word文档内容智能提取以及合成

《Python实现word文档内容智能提取以及合成》这篇文章主要为大家详细介绍了如何使用Python实现从10个左右的docx文档中抽取内容,再调整语言风格后生成新的文档,感兴趣的小伙伴可以了解一下... 目录核心思路技术路径实现步骤阶段一:准备工作阶段二:内容提取 (python 脚本)阶段三:语言风格调

Python结合PyWebView库打造跨平台桌面应用

《Python结合PyWebView库打造跨平台桌面应用》随着Web技术的发展,将HTML/CSS/JavaScript与Python结合构建桌面应用成为可能,本文将系统讲解如何使用PyWebView... 目录一、技术原理与优势分析1.1 架构原理1.2 核心优势二、开发环境搭建2.1 安装依赖2.2 验

一文详解如何在Python中从字符串中提取部分内容

《一文详解如何在Python中从字符串中提取部分内容》:本文主要介绍如何在Python中从字符串中提取部分内容的相关资料,包括使用正则表达式、Pyparsing库、AST(抽象语法树)、字符串操作... 目录前言解决方案方法一:使用正则表达式方法二:使用 Pyparsing方法三:使用 AST方法四:使用字

Python列表去重的4种核心方法与实战指南详解

《Python列表去重的4种核心方法与实战指南详解》在Python开发中,处理列表数据时经常需要去除重复元素,本文将详细介绍4种最实用的列表去重方法,有需要的小伙伴可以根据自己的需要进行选择... 目录方法1:集合(set)去重法(最快速)方法2:顺序遍历法(保持顺序)方法3:副本删除法(原地修改)方法4: