Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻

本文主要是介绍Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

a7b5231f2660551397e5f242bb28f124.png

最近有不少伙伴在交流群和公众号里面询问公式识别的工具。毫无疑问,目前在公式识别领域遥遥领先于同行的Mathpix是最佳的选择,咱之前在公众号里分别推荐了ta的软件包(科研必备神器推荐之Mathpix公式识别提取)和Mathpix API的matlab版调用方法(公式识别神器Mathpix for matlab 1.0.0版正式发布)。前者若是普通邮箱,每月可以免费使用50次识别,若是教育网邮箱,则每月可以免费使用100次识别;若使用后者API调用方式,则每月可以免费使用1000次免费识别,当然需要有信用卡先注册相应的账号才能使用,过程虽说不复杂,但有的伙伴反馈注册验证过程中往往会出现掉链子的情况。

既然是如此复杂,何必这般操心呢?真正免费的、离线的ta用起来不香吗?其今天即将给伙伴分享的这个公式识别工具其实很久之前就在公众号铁粉专属交流群—科研学术交流群里给他们分享过。不过看大家对公式识别需求这么大,咱就把这个压箱底(当然咱的箱底里可不止这一款)的工具分享出来,当然不排除咱们的关注者中已经有人在使用了这款工具。

今天分享的这款公式识别神器是由大神Lukas-Blecher开发的,采用Python语言编写,在Github中获得2.7K stars和311次forks,从上线至今,平均每月有超过3500次下载,火爆程度杠杠的。

52f13065faf7eca51dca467a4d2dce73.png

a6277dbf7ffe0ef5643629f04cce8a55.png

LaTex OCR的识别技术路线如下:

e550a253b3d3c81a10a6702544e7fb5d.png

其中最方便的莫过于它添加了GUI界面,可以直接截图识别而无需使用命令行操作。

LaTex-OCR的运行环境要求Python的版本3.7+,并安装相应依赖文件,如PyTorch,详情见setup.py文件中。LaTex-OCR提供三种包:GUI、API和Train,以下是三种包的安装命令:

① pix2tex[gui] (界面版,在CMD中输入latexocr命令直接调出GUI使用),安装命令为:

pip install pix2tex[gui]

② pix2tex[api] (API形式,Streamlit和docker),安装命令为:

pip install -U pix2tex[api]

③ pix2tex[train] (训练模块,支持用户训练自己的公式数据库,增强模型的自我创新能力),安装命令为:

pip install pix2tex[train]

测试效果动画:

0c1a396b39166b2e529d0ff740996cab.gif

以上就是今天分享的全部内容,望伙伴用得愉快,使用中若遇到什么问题,欢迎留言或直接到Latex-OCR项目的issue区搜寻答案或提问。

祝伙伴们生活、工作愉快,有缘再见!!!

参考资料:github.com/lukas-blecher/LaTeX-OCR

如需转载,请在公众号中回复“转载”获取授权,如未经授权擅自搬运抄袭的,本公众号将保留一切追责权利!

这篇关于Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/663088

相关文章

使用国内镜像源优化pip install下载的方法步骤

《使用国内镜像源优化pipinstall下载的方法步骤》在Python开发中,pip是一个不可或缺的工具,用于安装和管理Python包,然而,由于默认的PyPI服务器位于国外,国内用户在安装依赖时可... 目录引言1. 为什么需要国内镜像源?2. 常用的国内镜像源3. 临时使用国内镜像源4. 永久配置国内镜

详解如何使用Python提取视频文件中的音频

《详解如何使用Python提取视频文件中的音频》在多媒体处理中,有时我们需要从视频文件中提取音频,本文为大家整理了几种使用Python编程语言提取视频文件中的音频的方法,大家可以根据需要进行选择... 目录引言代码部分方法扩展引言在多媒体处理中,有时我们需要从视频文件中提取音频,以便进一步处理或分析。本文

python多种数据类型输出为Excel文件

《python多种数据类型输出为Excel文件》本文主要介绍了将Python中的列表、元组、字典和集合等数据类型输出到Excel文件中,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参... 目录一.列表List二.字典dict三.集合set四.元组tuplepython中的列表、元组、字典

VSCode配置Anaconda Python环境的实现

《VSCode配置AnacondaPython环境的实现》VisualStudioCode中可以使用Anaconda环境进行Python开发,本文主要介绍了VSCode配置AnacondaPytho... 目录前言一、安装 Visual Studio Code 和 Anaconda二、创建或激活 conda

Ubuntu中Nginx虚拟主机设置的项目实践

《Ubuntu中Nginx虚拟主机设置的项目实践》通过配置虚拟主机,可以在同一台服务器上运行多个独立的网站,本文主要介绍了Ubuntu中Nginx虚拟主机设置的项目实践,具有一定的参考价值,感兴趣的可... 目录简介安装 Nginx创建虚拟主机1. 创建网站目录2. 创建默认索引文件3. 配置 Nginx4

pytorch+torchvision+python版本对应及环境安装

《pytorch+torchvision+python版本对应及环境安装》本文主要介绍了pytorch+torchvision+python版本对应及环境安装,安装过程中需要注意Numpy版本的降级,... 目录一、版本对应二、安装命令(pip)1. 版本2. 安装全过程3. 命令相关解释参考文章一、版本对

讯飞webapi语音识别接口调用示例代码(python)

《讯飞webapi语音识别接口调用示例代码(python)》:本文主要介绍如何使用Python3调用讯飞WebAPI语音识别接口,重点解决了在处理语音识别结果时判断是否为最后一帧的问题,通过运行代... 目录前言一、环境二、引入库三、代码实例四、运行结果五、总结前言基于python3 讯飞webAPI语音

基于Python开发PDF转PNG的可视化工具

《基于Python开发PDF转PNG的可视化工具》在数字文档处理领域,PDF到图像格式的转换是常见需求,本文介绍如何利用Python的PyMuPDF库和Tkinter框架开发一个带图形界面的PDF转P... 目录一、引言二、功能特性三、技术架构1. 技术栈组成2. 系统架构javascript设计3.效果图

Python如何在Word中生成多种不同类型的图表

《Python如何在Word中生成多种不同类型的图表》Word文档中插入图表不仅能直观呈现数据,还能提升文档的可读性和专业性,本文将介绍如何使用Python在Word文档中创建和自定义各种图表,需要的... 目录在Word中创建柱形图在Word中创建条形图在Word中创建折线图在Word中创建饼图在Word

Python Excel实现自动添加编号

《PythonExcel实现自动添加编号》这篇文章主要为大家详细介绍了如何使用Python在Excel中实现自动添加编号效果,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍简单的说,就是在Excel中有一列h=会有重复