本文主要是介绍音频文件分析-- whisper(python 文档解析提取),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
使用whisper转文本,这里使用的是large-v3版本
pip install git+https://github.com/openai/whisper.git
import whisper
import os
from tqdm import tqdmmodel = whisper.load_model("large-v3")path = "rag_data"
for fi in tqdm(os.listdir(path)):file = os.path.join(path, fi)result = model.transcribe(file)text = result["text"]with open(os.path.join("rad_all_texts", file.split('.')[0] + ".txt"), 'a') as f:f.write(text + '\n')
参考
Introducing Whisper
OpenAI Whisper 新一代语音技术(更新至v3)
fine-tune-whisper
Whisper-Finetune
这篇关于音频文件分析-- whisper(python 文档解析提取)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!