音转文工具,9.8k star! 【送源码】

2024-05-09 21:36
文章标签 工具 源码 star 9.8 转文

本文主要是介绍音转文工具,9.8k star! 【送源码】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

我们经常会遇到将音频转为文字的情况,比如在开会时录音的会议纪要、上课时录下的老师讲课内容。虽然网上也有一些在线的工具可以将音频转为文字,但是考虑到数据安全和费用问题,使用起来也不是很方便。

今天了不起给大家介绍一款开源工具——Buzz,他可以让你在本地离线的识别音频并转换成文字。

项目介绍

Buzz 是一款开源的语音转文字工具,它能够实时将语音转换为文字,支持多种操作系统,包括 Windows、macOS 和 Linux。它不仅支持实时语音识别,还能将视频和音频文件转换成文字或字幕,极大地方便了内容创作者、翻译工作者和广大用户。

项目使用

因为是跨平台的工具,Windows 用户可以在 release 页面下载安装包,Mac 用户可以使用 brew install --cask buzz 命令安装应用。

打开应用,可以看到界面非常简洁:

点击上方菜单栏的“➕”,可以选择音频文件。之后在弹出的对话框中选择要使用的模型、任务以及语言。这里我们就使用默认的 Whisper 的 base 模型,任务选择“Transcribe”即可将语音转换为文字。

图片

点击“Run”按钮后,软件会自动下载模型文件,并进行转换。转换完毕的任务会在首页列表显示,如图:

双击任务,即可查看转换成功的文字,如图:

图片

你可以在这个页面查看每句话的所在的音频时间,并且播放音频。还可以点击右下角的下载按钮,将文件导出为 txt 格式或者 srt 的字幕格式。

当然,Buzz 还支持实时的语音转文字和翻译功能。首页点击左上角的小麦克风按钮,即可进入实时录音的界面。依旧是配置好使用的模型和任务类型,点击“Record”按钮,即可实时的转换文字了。

总结

随着开源的大型模型日益增多,以及 GitHub 上涌现的众多整合了这些大型模型的工具,我们得以以更低的门槛在个人电脑上运行这些模型,从而帮助我们完成更多的工作。Buzz 就是这么一款使用方便的语音转文字工具,如果你有类似的需求,就赶快去试试吧。

项目地址:https://github.com/chidiwilliams/buzz

—— EOF ——

 给大家分享一套基于Springboot+Vue图书管理系统源码,在实际项目中可以直接复用。(免费提供,文末自取)

​一、系统运行图(设计报告和接口文档)

1、登陆页面

2、后台页面

3、设计报告包含接口文档

二、系统搭建视频教程

源码免费领取方式

扫码后台回复 图书

 

这篇关于音转文工具,9.8k star! 【送源码】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/974561

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

高效录音转文字:2024年四大工具精选!

在快节奏的工作生活中,能够快速将录音转换成文字是一项非常实用的能力。特别是在需要记录会议纪要、讲座内容或者是采访素材的时候,一款优秀的在线录音转文字工具能派上大用场。以下推荐几个好用的录音转文字工具! 365在线转文字 直达链接:https://www.pdf365.cn/ 365在线转文字是一款提供在线录音转文字服务的工具,它以其高效、便捷的特点受到用户的青睐。用户无需下载安装任何软件,只

Java ArrayList扩容机制 (源码解读)

结论:初始长度为10,若所需长度小于1.5倍原长度,则按照1.5倍扩容。若不够用则按照所需长度扩容。 一. 明确类内部重要变量含义         1:数组默认长度         2:这是一个共享的空数组实例,用于明确创建长度为0时的ArrayList ,比如通过 new ArrayList<>(0),ArrayList 内部的数组 elementData 会指向这个 EMPTY_EL

如何在Visual Studio中调试.NET源码

今天偶然在看别人代码时,发现在他的代码里使用了Any判断List<T>是否为空。 我一般的做法是先判断是否为null,再判断Count。 看了一下Count的源码如下: 1 [__DynamicallyInvokable]2 public int Count3 {4 [__DynamicallyInvokable]5 get

工厂ERP管理系统实现源码(JAVA)

工厂进销存管理系统是一个集采购管理、仓库管理、生产管理和销售管理于一体的综合解决方案。该系统旨在帮助企业优化流程、提高效率、降低成本,并实时掌握各环节的运营状况。 在采购管理方面,系统能够处理采购订单、供应商管理和采购入库等流程,确保采购过程的透明和高效。仓库管理方面,实现库存的精准管理,包括入库、出库、盘点等操作,确保库存数据的准确性和实时性。 生产管理模块则涵盖了生产计划制定、物料需求计划、

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念

Spring 源码解读:自定义实现Bean定义的注册与解析

引言 在Spring框架中,Bean的注册与解析是整个依赖注入流程的核心步骤。通过Bean定义,Spring容器知道如何创建、配置和管理每个Bean实例。本篇文章将通过实现一个简化版的Bean定义注册与解析机制,帮助你理解Spring框架背后的设计逻辑。我们还将对比Spring中的BeanDefinition和BeanDefinitionRegistry,以全面掌握Bean注册和解析的核心原理。

超强的截图工具:PixPin

你是否还在为寻找一款功能强大、操作简便的截图工具而烦恼?市面上那么多工具,常常让人无从选择。今天,想给大家安利一款神器——PixPin,一款真正解放双手的截图工具。 想象一下,你只需要按下快捷键就能轻松完成多种截图任务,还能快速编辑、标注甚至保存多种格式的图片。这款工具能满足这些需求吗? PixPin不仅支持全屏、窗口、区域截图等基础功能,它还可以进行延时截图,让你捕捉到每个关键画面。不仅如此

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以打印WAV音频文件每个packet(也称为数据包或多媒体包)的信息,这些信息包含该packet的pts、dts: 打印出来的“pts”实际是AVPacket结构体中的成员变量pts,是以AVStream->time_base为单位的显

9.8javaweb项目总结

1.主界面用户信息显示 登录成功后,将用户信息存储在记录在 localStorage中,然后进入界面之前通过js来渲染主界面 存储用户信息 将用户信息渲染在主界面上,并且头像设置跳转,到个人资料界面 这里数据库中还没有设置相关信息 2.模糊查找 检测输入框是否有变更,有的话调用方法,进行查找 发送检测请求,然后接收的时候设置最多显示四个类似的搜索结果