20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)

2024-01-22 22:20

本文主要是介绍20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结
2024/1/22 19:52


结论:这个软件如果是习作,可以打101分,功能都实现了。
如果作为商业软件/共享软件,在易用性等方面,可能就只能有70分了。
【百分制】


可选的改进部分:
0、支持INTEL/AMD/ATI的显卡。并且给NVIDIA的显卡自动安装最新的驱动程序和CUDA版本!【对初学者友好!】
1、待转换的音频/视频目录:【中文路径/长目录】对特殊字符的支持
2、(识别)翻译成:语言可以按照拼音顺序排序。当然汉语/简体中文/普通话是可以放到最前面的!
3、计算精度,只列出来所支持的精度,并给出估计的识别时间!
4、打开输出目录。我第一次识别完成在会后就把 识别结果 这个目录剪切走了。
结果下一次识别的时候找不到 识别结果 这个目录,直接退出了!半小时白花了。
如果找到 识别结果 这个目录,可以直接新建的呀!
H:\BaiduNetdiskDownload\音视频转文字字幕小工具\识别结果
5、由于whisper体积庞大,文件众多,导致程序比较凌乱。实际上,根目录下只需要有这两个目录:whisper和 识别结果。

whisper
识别结果


缘起:为了使用openai的whisper识别小语种【非英语】电影的字幕,决定开始折腾CUDA了!
https://github.com/openai/whisper
https://www.bilibili.com/video/BV1d34y1F7qA
https://www.bilibili.com/video/BV1d34y1F7qA/?p=4&vd_source=4a6b675fa22dfa306da59f67b1f22616


1、待转换的音频/视频目录:c:/temp
测试发现只支持英文+数字目录。
【不要使用中文路径/长目录】


2、调用设备:显卡/CPU
你就找一片NVIDIA的CPU吧。
手头紧可以考虑二手:拼多多/淘宝


3、模型:whisper-large-v3就可以了。
不需要特别选择V2版本。


4、计算精度:
float16  不支持x
int8  支持
int8_float16  不支持x
int8_bfloat16  不支持x
bfloat16  不支持x

int8_float32  支持
int16  不支持x
float32  支持

int8_float32  支持【显存占用大概30%?】

float32  支持【显存占用几乎100%,几乎8GB全部占用了!】


5、版权;
由于内核是OpenAI所开源的【whisper】,收费就呵呵了!^_
不过whisper没有UI界面?
有人花时间整理出来,收点小钱¥也不是那么不可以接受的!
有能力的同学可以适当打赏点吧!


参考资料:
https://blog.csdn.net/weixin_42074867/article/details/90046478
win10 GTX1080配置Python CUDA、CUDNN支持

https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/cuda-toolkit-archive
CUDA Toolkit Archive

https://developer.nvidia.com/cuda-12-0-0-download-archive
CUDA Toolkit 12.0.0 (December 2022), Versioned Online Documentation

安装好就可以运行 音|视频转文字|字幕小工具V1.2【openai的whisper】


百度:WIN10 进入安全模式
https://baijiahao.baidu.com/s?id=1773719082166223864&wfr=spider&for=pc
Win10系统电脑进入安全模式的四种方法,让你轻松应对各种问题

方法一:通过强制关机进入自动修复界面
1.当电脑启动时,在Win10启动logo界面按住电源键强制关机,重复此操作三次。


http://www.baike6.com/b385814.html
电脑win10无法正常开机怎么办


https://www.jb51.net/os/win10/811307.html
win10怎么进安全模式 win10系统8种进安全模式方法

https://www.laomaotao.net/more/2023/0728/11528.html
Win10你的电脑未能启动的有效修复方法


https://www.xitongzhijia.net/xtjc/20230221/279941.html
电脑未正确启动怎么办?六种方法解决!(Win10/Win11通用)


https://www.microsoft.com/zh-cn/software-download/windows10
下载 Windows 10

这篇关于20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/634423

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

高效录音转文字:2024年四大工具精选!

在快节奏的工作生活中,能够快速将录音转换成文字是一项非常实用的能力。特别是在需要记录会议纪要、讲座内容或者是采访素材的时候,一款优秀的在线录音转文字工具能派上大用场。以下推荐几个好用的录音转文字工具! 365在线转文字 直达链接:https://www.pdf365.cn/ 365在线转文字是一款提供在线录音转文字服务的工具,它以其高效、便捷的特点受到用户的青睐。用户无需下载安装任何软件,只

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]