py 多线程 m3u8 转mp4 过滤广告,结合ffmpeg使用

2024-09-01 08:44

本文主要是介绍py 多线程 m3u8 转mp4 过滤广告,结合ffmpeg使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

python代码:

import csv
import os
import subprocess
from concurrent.futures import ThreadPoolExecutor, as_completed
from urllib.parse import urljoin
import sys
import requestsdef resource_path(relative_path):"""获取资源文件的绝对路径,兼容PyInstaller打包后的环境"""try:base_path = sys._MEIPASSexcept AttributeError:base_path = os.path.abspath(".")return os.path.join(base_path, relative_path)def process_csv(csv_file, output_dir, begin_num, max_workers=8):csv_file = resource_path(csv_file)with open(csv_file, 'r', encoding='utf-8') as file:reader = csv.reader(file)next(reader)  # 跳过表头with ThreadPoolExecutor(max_workers=max_workers) as executor:futures = []try:for index, row in enumerate(reader, start=1):if index < begin_num:continueprint(f"Processing row {index}...")title, _, m3u8_url = rowbase_name = f"{index}.m3u8"cleaned_m3u8_file_name = f"{index}_cleaned.m3u8"# 提交任务到线程池future = executor.submit(download_and_process_m3u8, m3u8_url, output_dir, base_name,cleaned_m3u8_file_name, title, index)futures.append(future)# 等待所有线程完成for future in as_completed(futures):try:future.result()except Exception as e:print(f"Task generated an exception: {e}")except KeyboardInterrupt:print("用户中断,正在取消所有任务...")for future in futures:future.cancel()executor.shutdown(wait=False)sys.exit(1)def download_and_process_m3u8(m3u8_url, output_dir, m3u8_file_name, cleaned_m3u8_file_name, title, index):m3u8_content = requests.get(m3u8_url).textprint(f"Downloaded m3u8 file from {m3u8_url}, content: {m3u8_content}")m3u8_file_path = os.path.join(output_dir, m3u8_file_name)with open(m3u8_file_path, 'w') as m3u8_file:m3u8_file.write(m3u8_content)print(f"m3u8 file downloaded and saved as {m3u8_file_path}")tsM3u8 = os.path.join(output_dir, f"{index}_ts.m3u8")download_ts_files(m3u8_file_path, m3u8_url, tsM3u8)cleaned_m3u8_file_path = os.path.join(output_dir, cleaned_m3u8_file_name)cleaned_m3u8_path = filter_advertisement(m3u8_url, tsM3u8, cleaned_m3u8_file_path)convert_to_mp4(cleaned_m3u8_path, "video_output", title, index)def download_ts_files(m3u8_file_path, m3u8_url, ts_filename):with open(m3u8_file_path, 'r') as m3u8_file:lines = m3u8_file.readlines()for line in lines:if line.startswith('#'):continuets_url = urljoin(m3u8_url, line.strip())with requests.get(ts_url, stream=True) as r:if r.status_code == 200:with open(ts_filename, 'wb') as ts_file:for chunk in r.iter_content(chunk_size=8192):ts_file.write(chunk)print(f"Downloaded {ts_filename}")else:print(f"Failed to download {ts_url}, status code: {r.status_code}")print("All .ts files have been downloaded.")def filter_advertisement(base_url, m3u8_file_path, cleaned_m3u8_file_path):with open(m3u8_file_path, 'r') as m3u8_file:lines = m3u8_file.readlines()cleaned_lines = []skip = Falsead_removed = Falsefor i, line in enumerate(lines):if line.startswith("#EXT-X-KEY") and not ad_removed:skip = Truead_removed = Trueprint(f"Removing key and associated segments starting with: {line.strip()}")continueif skip and line.startswith("#EXTINF"):continueif skip and (line.startswith("http") or line.startswith("/")):continueif line.strip().startswith("https"):last_element = cleaned_lines[-1]if last_element.startswith("#EXTINF"):cleaned_lines.pop()continueif skip and line.startswith("#EXT-X-DISCONTINUITY"):skip = Falseif not skip:cleaned_lines.append(line)new_lines = []for line in cleaned_lines:if line.startswith('#EXT-X-KEY'):uri_part = line.split('URI="')[1].split('"')[0]if not uri_part.startswith('http'):full_uri = urljoin(base_url, uri_part)line = line.replace(uri_part, full_uri)new_lines.append(line)elif line.startswith('/') and not line.startswith('http'):line = urljoin(base_url, line.strip())new_lines.append(line + "\n")else:new_lines.append(line)with open(cleaned_m3u8_file_path, 'w') as cleaned_m3u8_file:cleaned_m3u8_file.writelines(new_lines)print(f"Filtered m3u8 file saved as {cleaned_m3u8_file_path}")return cleaned_m3u8_file_pathdef convert_to_mp4(m3u8_file_path, output_dir, title, index):output_mp4 = os.path.join(output_dir, f"{index}_{title}.mp4")ffmpeg_command = ["ffmpeg","-protocol_whitelist", "file,http,https,tcp,tls,crypto","-i", m3u8_file_path,"-c", "copy","-bsf:a", "aac_adtstoasc",f"{output_mp4}"]print(f"命令行:{' '.join(ffmpeg_command)}")try:subprocess.run(ffmpeg_command, check=True)print(f"Successfully created {output_mp4}")except subprocess.CalledProcessError as e:print(f"Failed to create MP4: {e}")if __name__ == "__main__":csv_file = "ai_video.csv"output_dir = "ts_files"video_outputh = "video_output"max_workers = 4if not os.path.exists(video_outputh):os.makedirs(video_outputh)if not os.path.exists(output_dir):os.makedirs(output_dir)files = [f for f in os.listdir(video_outputh) ifos.path.isfile(os.path.join(video_outputh, f)) and not f.startswith('.')]files_sorted = sorted(files, key=lambda x: int(x.split('_')[0]))print("files:", files_sorted)begin_num = 1if files_sorted:last_file = files_sorted[-1]num = int(last_file.split('_')[0])if num > 0 and num - max_workers > 0:begin_num = num - max_workers + 1print("最后一个文件名是:", last_file, begin_num)else:print("目录中没有符合条件的文件。")try:process_csv(csv_file, output_dir, begin_num, max_workers=max_workers)except KeyboardInterrupt:print("程序被用户中断。")

写入 pip freeze > requirements.txt

打包使用github action
mkdir -p .github/workflows

name: Build Windows Executableon: [push]jobs:build:runs-on: windows-lateststeps:- name: Checkout codeuses: actions/checkout@v2- name: Set up Pythonuses: actions/setup-python@v2with:python-version: '3.12.4'  # 使用适合你的 Python 版本- name: Install dependenciesrun: |python -m pip install --upgrade pippip install pyinstaller requests  # 安装 pyinstaller 和 requestspip install -r requirements.txt  # 如果你有 requirements.txt 文件- name: Build executablerun: pyinstaller --onefile --add-data "ai_video.csv;." test_ts.py- name: Upload artifactuses: actions/upload-artifact@v2with:name: Windows Executablepath: dist/test_ts.exe

ffmpeg 常用命令


ffmpeg -i demo.mp4 -ss 1 -f image2 -vframes 1 out.jpg  // 原视频截图
ffmpeg -hide_banner -i demo.mp4 -i logo.png -filter_complex "overlay=x=xxx:y=xxx" with_watermark.mp4 -y // 原视频添加水印
ffmpeg -i with_watermark.mp4 -ss 1 -f image2 -vframes 1 with_watermark.jpg  // 对添加水印视频截图
ffmpeg -i with_watermark.mp4 -vf "delogo=x=xxx:y=xxx:w=xxx:h=xxx:show=0" -c:a copy no_watermark.mp4 // 给添加水印的视频,去除水印
ffmpeg -protocol_whitelist "file,http,https,tcp,tls,crypto" -i ./ts_files/cleaned_index.m3u8 -c copy -bsf:a aac_adtstoasc output.mp4 转成视频
ffmpeg -i "https://xxx.com/20240814/Zf8gOK3i/index.m3u8" -c copy output.ts 转视频ps网页榜:https://www.nuanque.com/ps/ffmpeg -i demo.mp4 -ss 16 -f image2 -vframes 1 out.jpg  // 原视频截图
ffmpeg -i demo.mp4 -vf "delogo=x=892:y=589:w=385:h=113:show=0" -c:a copy no_watermark.mp4 // 给添加水印的视频,去除水印
ffmpeg -i demo.mp4 -vf "delogo=x=892:y=589:w=385:h=113:show=0, delogo=x=100:y=100:w=150:h=50:show=0" -c:a copy no_watermark.mp4

这篇关于py 多线程 m3u8 转mp4 过滤广告,结合ffmpeg使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1126465

相关文章

Mybatis官方生成器的使用方式

《Mybatis官方生成器的使用方式》本文详细介绍了MyBatisGenerator(MBG)的使用方法,通过实际代码示例展示了如何配置Maven插件来自动化生成MyBatis项目所需的实体类、Map... 目录1. MyBATis Generator 简介2. MyBatis Generator 的功能3

Python中使用defaultdict和Counter的方法

《Python中使用defaultdict和Counter的方法》本文深入探讨了Python中的两个强大工具——defaultdict和Counter,并详细介绍了它们的工作原理、应用场景以及在实际编... 目录引言defaultdict的深入应用什么是defaultdictdefaultdict的工作原理

使用Python进行文件读写操作的基本方法

《使用Python进行文件读写操作的基本方法》今天的内容来介绍Python中进行文件读写操作的方法,这在学习Python时是必不可少的技术点,希望可以帮助到正在学习python的小伙伴,以下是Pyth... 目录一、文件读取:二、文件写入:三、文件追加:四、文件读写的二进制模式:五、使用 json 模块读写

Python使用qrcode库实现生成二维码的操作指南

《Python使用qrcode库实现生成二维码的操作指南》二维码是一种广泛使用的二维条码,因其高效的数据存储能力和易于扫描的特点,广泛应用于支付、身份验证、营销推广等领域,Pythonqrcode库是... 目录一、安装 python qrcode 库二、基本使用方法1. 生成简单二维码2. 生成带 Log

Python如何使用seleniumwire接管Chrome查看控制台中参数

《Python如何使用seleniumwire接管Chrome查看控制台中参数》文章介绍了如何使用Python的seleniumwire库来接管Chrome浏览器,并通过控制台查看接口参数,本文给大家... 1、cmd打开控制台,启动谷歌并制定端口号,找不到文件的加环境变量chrome.exe --rem

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

使用C#代码计算数学表达式实例

《使用C#代码计算数学表达式实例》这段文字主要讲述了如何使用C#语言来计算数学表达式,该程序通过使用Dictionary保存变量,定义了运算符优先级,并实现了EvaluateExpression方法来... 目录C#代码计算数学表达式该方法很长,因此我将分段描述下面的代码片段显示了下一步以下代码显示该方法如

Go语言使用Buffer实现高性能处理字节和字符

《Go语言使用Buffer实现高性能处理字节和字符》在Go中,bytes.Buffer是一个非常高效的类型,用于处理字节数据的读写操作,本文将详细介绍一下如何使用Buffer实现高性能处理字节和... 目录1. bytes.Buffer 的基本用法1.1. 创建和初始化 Buffer1.2. 使用 Writ

redis-cli命令行工具的使用小结

《redis-cli命令行工具的使用小结》redis-cli是Redis的命令行客户端,支持多种参数用于连接、操作和管理Redis数据库,本文给大家介绍redis-cli命令行工具的使用小结,感兴趣的... 目录基本连接参数基本连接方式连接远程服务器带密码连接操作与格式参数-r参数重复执行命令-i参数指定命

PyTorch使用教程之Tensor包详解

《PyTorch使用教程之Tensor包详解》这篇文章介绍了PyTorch中的张量(Tensor)数据结构,包括张量的数据类型、初始化、常用操作、属性等,张量是PyTorch框架中的核心数据结构,支持... 目录1、张量Tensor2、数据类型3、初始化(构造张量)4、常用操作5、常用属性5.1 存储(st