py 多线程 m3u8 转mp4 过滤广告,结合ffmpeg使用

2024-09-01 08:44

本文主要是介绍py 多线程 m3u8 转mp4 过滤广告,结合ffmpeg使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

python代码:

import csv
import os
import subprocess
from concurrent.futures import ThreadPoolExecutor, as_completed
from urllib.parse import urljoin
import sys
import requestsdef resource_path(relative_path):"""获取资源文件的绝对路径,兼容PyInstaller打包后的环境"""try:base_path = sys._MEIPASSexcept AttributeError:base_path = os.path.abspath(".")return os.path.join(base_path, relative_path)def process_csv(csv_file, output_dir, begin_num, max_workers=8):csv_file = resource_path(csv_file)with open(csv_file, 'r', encoding='utf-8') as file:reader = csv.reader(file)next(reader)  # 跳过表头with ThreadPoolExecutor(max_workers=max_workers) as executor:futures = []try:for index, row in enumerate(reader, start=1):if index < begin_num:continueprint(f"Processing row {index}...")title, _, m3u8_url = rowbase_name = f"{index}.m3u8"cleaned_m3u8_file_name = f"{index}_cleaned.m3u8"# 提交任务到线程池future = executor.submit(download_and_process_m3u8, m3u8_url, output_dir, base_name,cleaned_m3u8_file_name, title, index)futures.append(future)# 等待所有线程完成for future in as_completed(futures):try:future.result()except Exception as e:print(f"Task generated an exception: {e}")except KeyboardInterrupt:print("用户中断,正在取消所有任务...")for future in futures:future.cancel()executor.shutdown(wait=False)sys.exit(1)def download_and_process_m3u8(m3u8_url, output_dir, m3u8_file_name, cleaned_m3u8_file_name, title, index):m3u8_content = requests.get(m3u8_url).textprint(f"Downloaded m3u8 file from {m3u8_url}, content: {m3u8_content}")m3u8_file_path = os.path.join(output_dir, m3u8_file_name)with open(m3u8_file_path, 'w') as m3u8_file:m3u8_file.write(m3u8_content)print(f"m3u8 file downloaded and saved as {m3u8_file_path}")tsM3u8 = os.path.join(output_dir, f"{index}_ts.m3u8")download_ts_files(m3u8_file_path, m3u8_url, tsM3u8)cleaned_m3u8_file_path = os.path.join(output_dir, cleaned_m3u8_file_name)cleaned_m3u8_path = filter_advertisement(m3u8_url, tsM3u8, cleaned_m3u8_file_path)convert_to_mp4(cleaned_m3u8_path, "video_output", title, index)def download_ts_files(m3u8_file_path, m3u8_url, ts_filename):with open(m3u8_file_path, 'r') as m3u8_file:lines = m3u8_file.readlines()for line in lines:if line.startswith('#'):continuets_url = urljoin(m3u8_url, line.strip())with requests.get(ts_url, stream=True) as r:if r.status_code == 200:with open(ts_filename, 'wb') as ts_file:for chunk in r.iter_content(chunk_size=8192):ts_file.write(chunk)print(f"Downloaded {ts_filename}")else:print(f"Failed to download {ts_url}, status code: {r.status_code}")print("All .ts files have been downloaded.")def filter_advertisement(base_url, m3u8_file_path, cleaned_m3u8_file_path):with open(m3u8_file_path, 'r') as m3u8_file:lines = m3u8_file.readlines()cleaned_lines = []skip = Falsead_removed = Falsefor i, line in enumerate(lines):if line.startswith("#EXT-X-KEY") and not ad_removed:skip = Truead_removed = Trueprint(f"Removing key and associated segments starting with: {line.strip()}")continueif skip and line.startswith("#EXTINF"):continueif skip and (line.startswith("http") or line.startswith("/")):continueif line.strip().startswith("https"):last_element = cleaned_lines[-1]if last_element.startswith("#EXTINF"):cleaned_lines.pop()continueif skip and line.startswith("#EXT-X-DISCONTINUITY"):skip = Falseif not skip:cleaned_lines.append(line)new_lines = []for line in cleaned_lines:if line.startswith('#EXT-X-KEY'):uri_part = line.split('URI="')[1].split('"')[0]if not uri_part.startswith('http'):full_uri = urljoin(base_url, uri_part)line = line.replace(uri_part, full_uri)new_lines.append(line)elif line.startswith('/') and not line.startswith('http'):line = urljoin(base_url, line.strip())new_lines.append(line + "\n")else:new_lines.append(line)with open(cleaned_m3u8_file_path, 'w') as cleaned_m3u8_file:cleaned_m3u8_file.writelines(new_lines)print(f"Filtered m3u8 file saved as {cleaned_m3u8_file_path}")return cleaned_m3u8_file_pathdef convert_to_mp4(m3u8_file_path, output_dir, title, index):output_mp4 = os.path.join(output_dir, f"{index}_{title}.mp4")ffmpeg_command = ["ffmpeg","-protocol_whitelist", "file,http,https,tcp,tls,crypto","-i", m3u8_file_path,"-c", "copy","-bsf:a", "aac_adtstoasc",f"{output_mp4}"]print(f"命令行:{' '.join(ffmpeg_command)}")try:subprocess.run(ffmpeg_command, check=True)print(f"Successfully created {output_mp4}")except subprocess.CalledProcessError as e:print(f"Failed to create MP4: {e}")if __name__ == "__main__":csv_file = "ai_video.csv"output_dir = "ts_files"video_outputh = "video_output"max_workers = 4if not os.path.exists(video_outputh):os.makedirs(video_outputh)if not os.path.exists(output_dir):os.makedirs(output_dir)files = [f for f in os.listdir(video_outputh) ifos.path.isfile(os.path.join(video_outputh, f)) and not f.startswith('.')]files_sorted = sorted(files, key=lambda x: int(x.split('_')[0]))print("files:", files_sorted)begin_num = 1if files_sorted:last_file = files_sorted[-1]num = int(last_file.split('_')[0])if num > 0 and num - max_workers > 0:begin_num = num - max_workers + 1print("最后一个文件名是:", last_file, begin_num)else:print("目录中没有符合条件的文件。")try:process_csv(csv_file, output_dir, begin_num, max_workers=max_workers)except KeyboardInterrupt:print("程序被用户中断。")

写入 pip freeze > requirements.txt

打包使用github action
mkdir -p .github/workflows

name: Build Windows Executableon: [push]jobs:build:runs-on: windows-lateststeps:- name: Checkout codeuses: actions/checkout@v2- name: Set up Pythonuses: actions/setup-python@v2with:python-version: '3.12.4'  # 使用适合你的 Python 版本- name: Install dependenciesrun: |python -m pip install --upgrade pippip install pyinstaller requests  # 安装 pyinstaller 和 requestspip install -r requirements.txt  # 如果你有 requirements.txt 文件- name: Build executablerun: pyinstaller --onefile --add-data "ai_video.csv;." test_ts.py- name: Upload artifactuses: actions/upload-artifact@v2with:name: Windows Executablepath: dist/test_ts.exe

ffmpeg 常用命令


ffmpeg -i demo.mp4 -ss 1 -f image2 -vframes 1 out.jpg  // 原视频截图
ffmpeg -hide_banner -i demo.mp4 -i logo.png -filter_complex "overlay=x=xxx:y=xxx" with_watermark.mp4 -y // 原视频添加水印
ffmpeg -i with_watermark.mp4 -ss 1 -f image2 -vframes 1 with_watermark.jpg  // 对添加水印视频截图
ffmpeg -i with_watermark.mp4 -vf "delogo=x=xxx:y=xxx:w=xxx:h=xxx:show=0" -c:a copy no_watermark.mp4 // 给添加水印的视频,去除水印
ffmpeg -protocol_whitelist "file,http,https,tcp,tls,crypto" -i ./ts_files/cleaned_index.m3u8 -c copy -bsf:a aac_adtstoasc output.mp4 转成视频
ffmpeg -i "https://xxx.com/20240814/Zf8gOK3i/index.m3u8" -c copy output.ts 转视频ps网页榜:https://www.nuanque.com/ps/ffmpeg -i demo.mp4 -ss 16 -f image2 -vframes 1 out.jpg  // 原视频截图
ffmpeg -i demo.mp4 -vf "delogo=x=892:y=589:w=385:h=113:show=0" -c:a copy no_watermark.mp4 // 给添加水印的视频,去除水印
ffmpeg -i demo.mp4 -vf "delogo=x=892:y=589:w=385:h=113:show=0, delogo=x=100:y=100:w=150:h=50:show=0" -c:a copy no_watermark.mp4

这篇关于py 多线程 m3u8 转mp4 过滤广告,结合ffmpeg使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1126465

相关文章

使用Java实现通用树形结构构建工具类

《使用Java实现通用树形结构构建工具类》这篇文章主要为大家详细介绍了如何使用Java实现通用树形结构构建工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录完整代码一、设计思想与核心功能二、核心实现原理1. 数据结构准备阶段2. 循环依赖检测算法3. 树形结构构建4. 搜索子

GORM中Model和Table的区别及使用

《GORM中Model和Table的区别及使用》Model和Table是两种与数据库表交互的核心方法,但它们的用途和行为存在著差异,本文主要介绍了GORM中Model和Table的区别及使用,具有一... 目录1. Model 的作用与特点1.1 核心用途1.2 行为特点1.3 示例China编程代码2. Tab

SpringBoot使用OkHttp完成高效网络请求详解

《SpringBoot使用OkHttp完成高效网络请求详解》OkHttp是一个高效的HTTP客户端,支持同步和异步请求,且具备自动处理cookie、缓存和连接池等高级功能,下面我们来看看SpringB... 目录一、OkHttp 简介二、在 Spring Boot 中集成 OkHttp三、封装 OkHttp

使用Python实现获取网页指定内容

《使用Python实现获取网页指定内容》在当今互联网时代,网页数据抓取是一项非常重要的技能,本文将带你从零开始学习如何使用Python获取网页中的指定内容,希望对大家有所帮助... 目录引言1. 网页抓取的基本概念2. python中的网页抓取库3. 安装必要的库4. 发送HTTP请求并获取网页内容5. 解

一文教你Python引入其他文件夹下的.py文件

《一文教你Python引入其他文件夹下的.py文件》这篇文章主要为大家详细介绍了如何在Python中引入其他文件夹里的.py文件,并探讨几种常见的实现方式,有需要的小伙伴可以根据需求进行选择... 目录1. 使用sys.path动态添加路径2. 使用相对导入(适用于包结构)3. 使用pythonPATH环境

使用Python实现网络设备配置备份与恢复

《使用Python实现网络设备配置备份与恢复》网络设备配置备份与恢复在网络安全管理中起着至关重要的作用,本文为大家介绍了如何通过Python实现网络设备配置备份与恢复,需要的可以参考下... 目录一、网络设备配置备份与恢复的概念与重要性二、网络设备配置备份与恢复的分类三、python网络设备配置备份与恢复实

C#中的 StreamReader/StreamWriter 使用示例详解

《C#中的StreamReader/StreamWriter使用示例详解》在C#开发中,StreamReader和StreamWriter是处理文本文件的核心类,属于System.IO命名空间,本... 目录前言一、什么是 StreamReader 和 StreamWriter?1. 定义2. 特点3. 用

Python使用date模块进行日期处理的终极指南

《Python使用date模块进行日期处理的终极指南》在处理与时间相关的数据时,Python的date模块是开发者最趁手的工具之一,本文将用通俗的语言,结合真实案例,带您掌握date模块的六大核心功能... 目录引言一、date模块的核心功能1.1 日期表示1.2 日期计算1.3 日期比较二、六大常用方法详

Python使用DrissionPage中ChromiumPage进行自动化网页操作

《Python使用DrissionPage中ChromiumPage进行自动化网页操作》DrissionPage作为一款轻量级且功能强大的浏览器自动化库,为开发者提供了丰富的功能支持,本文将使用Dri... 目录前言一、ChromiumPage基础操作1.初始化Drission 和 ChromiumPage

Django序列化中SerializerMethodField的使用详解

《Django序列化中SerializerMethodField的使用详解》:本文主要介绍Django序列化中SerializerMethodField的使用,具有很好的参考价值,希望对大家有所帮... 目录SerializerMethodField的基本概念使用SerializerMethodField的