炸了!这个GitHub开源项目绝对要火!涵盖OCR功能、语音合成!

2023-10-10 11:40

本文主要是介绍炸了!这个GitHub开源项目绝对要火!涵盖OCR功能、语音合成!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方“Github爱好者社区”,选择星标

回复“资料”,获取小编整理的一份资料

今天小编为大家推荐一个相当牛逼的项目,

粗略估计,这个项目价值超过百万

当前star 1.9k,但是大胆预判,

这个项目肯定要火,未来Star数应该可以到10k甚至20k!

着急的,可以Github直接去看源码

传送门:

https://github.com/PaddlePaddle/PaddleHub

啥也不说,带着大家看一些项目Readme 截图

先看简介

首先,“无需深度学习背景、无需数据与训练过程”,“共享人工智能时代红利”以及“全部模型开源下载,离线可运行”

我只能说,

这个repo,绝对是伸手党福音!

继续看特性部分,

涵盖的模型数量,CV、NLP、Audio、Video四大品类全覆盖,覆盖足够丰富

使用方法:一键预测、一键服务化、十行代码迁移,技术门槛足够降低。

咱们继续往下看近期更新

从数量上看,目前总数已经超过了180个,基本上是每个月都保持10-20个更新,而且更新的速度应该是越来越快,这个已经感觉到很爽了啊

从质量上再看看呢,(前方动图高能预警!)

文本识别

包含超轻量中英文OCR模型,高精度中英文、多语种德语、法语、日语、韩语OCR识别。

人脸检测

包含人脸检测,口罩人脸检测,多种算法可选。

图像编辑

4倍超分效果,多种超分算法可选。

黑白图片上色,可用于老旧照片修复,

图像超分辨率   黑白图片上色

目标检测

包含行人检测、车辆检测,更有工业级超大规模预训练模型可选。

关键点检测


包含单人、多人身体关键点检测、面部关键点检测、手部关键点检测。

图像分割

包含效果卓越的人像抠图模型、ACE2P人体解析世界冠军模型

图像动漫化

包含宫崎骏、新海诚在内的多位漫画家风格迁移,多种算法可选

图像分类

包含动物分类、菜品分类、野生动物制品分类,多种算法可选

词法分析

效果优秀的中文分词、词性标注与命名实体识别的模型。

文本生成

包含AI写诗、AI对联、AI情话、AI藏头诗,多种算法可选。

句法分析

效果领先的中文句法分析模型。

情感分析

支持中文的评论情感分析

文本审核

包含中文色情文本的审核,多种算法可选。

语音合成

TTS语音合成算法,多种算法可选

输入:Life was like a box of chocolates, you never know what you're gonna get.

合成效果如下:

合成音效

视频分类

包含短视频分类,支持3000+标签种类,可输出TOP-K标签,多种算法可选。

举例:输入一段游泳的短视频,算法可以输出"游泳"结果

以上动图中用到的预训练模型

全部开源,离线可下载,免费使用!!!

到底应该怎么用呢?别着急,咱们往下看

别的不需要多说了,大家上github上点过star之后自己体验吧,

https://github.com/PaddlePaddle/PaddleHub

另外呢,repo中也贴心的给出了官方微信群,有问题可以进群,答疑更高效。

如扫码失败,请添加微信:15704308458,运营同学会邀请您入群

更多相关内容,请参阅以下内容。

官网地址:https://www.paddlepaddle.org.cn/hub

项目地址:

GitHub: https://github.com/PaddlePaddle/PaddleHub

Gitee: https://gitee.com/paddlepaddle/PaddleHub

好啦,今天的分享就到这儿啦,我们下次见啦~GitHub原创推荐•  GitHub上买房攻略开源,一夜之间涨星近千,网友说:正好需要!•  简直太牛了!这个微信插件神器开源,怒冲GitHub排名榜第一,网友:太好用了!•  微软开源又一力作发布!刷屏GitHub!炸了。。•  GitHub标星1.4k+,IDEA 中相见恨晚的技巧,让你的编程效率飞起来!•  还在买爱奇艺,腾讯会员?GitHub这个神器标星12.2K,强势开源,支持多个视频网站片源下载 !!关注「Github爱好者社区」加星标,每天带你逛Github好玩的项目

这篇关于炸了!这个GitHub开源项目绝对要火!涵盖OCR功能、语音合成!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/180195

相关文章

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

在cscode中通过maven创建java项目

在cscode中创建java项目 可以通过博客完成maven的导入 建立maven项目 使用快捷键 Ctrl + Shift + P 建立一个 Maven 项目 1 Ctrl + Shift + P 打开输入框2 输入 "> java create"3 选择 maven4 选择 No Archetype5 输入 域名6 输入项目名称7 建立一个文件目录存放项目,文件名一般为项目名8 确定

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

安全管理体系化的智慧油站开源了。

AI视频监控平台简介 AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作,就可以实现全视频的接入及布控。摄像头管理模块用于多种终端设备、智能设备的接入及管理。平台支持包括摄像头等终端感知设备接入,为整个平台提

Vue3项目开发——新闻发布管理系统(六)

文章目录 八、首页设计开发1、页面设计2、登录访问拦截实现3、用户基本信息显示①封装用户基本信息获取接口②用户基本信息存储③用户基本信息调用④用户基本信息动态渲染 4、退出功能实现①注册点击事件②添加退出功能③数据清理 5、代码下载 八、首页设计开发 登录成功后,系统就进入了首页。接下来,也就进行首页的开发了。 1、页面设计 系统页面主要分为三部分,左侧为系统的菜单栏,右侧

K8S(Kubernetes)开源的容器编排平台安装步骤详解

K8S(Kubernetes)是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。以下是K8S容器编排平台的安装步骤、使用方式及特点的概述: 安装步骤: 安装Docker:K8S需要基于Docker来运行容器化应用程序。首先要在所有节点上安装Docker引擎。 安装Kubernetes Master:在集群中选择一台主机作为Master节点,安装K8S的控制平面组件,如AP