【前端甜点】某视频网站的m4s视频/音频下载方案(20240420)

2024-04-21 06:12

本文主要是介绍【前端甜点】某视频网站的m4s视频/音频下载方案(20240420),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

引言

Sample:aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMWZKNDExUTdWeA==

我在很久以前写过一个小脚本,发XHR请求来获取某视频网站的m4s视频和音频:

// 唯一要改变的就是url(url must be https),a.download是文件名,只有Chrome和Firefox可用
function downloader(url, fname, rangeStart = 0) {let xhr = new XMLHttpRequest();xhr.open('GET', url, true);xhr.responseType = 'blob';// 啥请求头都没法设置:xhr.setRequestHeader("client_type", "DESKTOP_WEB");xhr.setRequestHeader('Range', `bytes=${rangeStart}-`);xhr.onload = function () {if (this.status === 200 || this.status === 206) {let blob = new Blob([this.response]);const blobUrl = window.URL.createObjectURL(blob);let a = document.createElement('a');a.download = fname;a.target = '_blank';a.href = blobUrl;console.log(a.href, this.response);document.body.append(a);a.click();}};xhr.send();
}// 下载音频(复制到console里,注意分2次执行)
downloader('<m4s audio>', '1.mp3');
downloader('<m4s video>', '1.mp4');

从20年到上个月为止,it just works well。但20240420开始,不知道是Chrome浏览器升级还是什么原因,二进制数据包装的Blob对象转化为a标签后域名变成了https://www.example.comhttps://www.example.com/...,无法方便地下载m4s了,于是这个脚本不能用了。这个原因我一直都没找到。

作者:hans774882968以及hans774882968以及hans774882968

本文52pojie:https://www.52pojie.cn/thread-1915933-1-1.html

本文juejin:https://juejin.cn/post/7359821247676334115

本文CSDN:https://blog.csdn.net/hans774882968/article/details/138015611

正文

好在我很快又摸索出了一个稍微麻烦点的路子:先在浏览器控制台运行JS代码,获取base64字符串,然后在本地用python把它转为mp3。

在上述古老的脚本里,我将XHR返回的类型指定为Blob了,因此我需要将其转为base64字符串。最后我找到的API是FileReaderscrapt_m4s_new.js

// https://www.cnblogs.com/Sherries/p/14840404.html
function blobToDataURI(blob) {return new Promise((res, rej) => {const reader = new FileReader();reader.readAsDataURL(blob);reader.onload = (e) => {res(e.target.result);};reader.onerror = () => {rej(new Error('文件流异常'));};});
}// 唯一要改变的就是url(url must be https),a.download是文件名,只有Chrome和Firefox可用
function sendXhrReq(url, rangeStart = 0) {return new Promise((res, rej) => {const xhr = new XMLHttpRequest();xhr.open('GET', url, true);xhr.responseType = 'blob';// 啥请求头都没法设置:xhr.setRequestHeader("client_type", "DESKTOP_WEB");xhr.setRequestHeader('Range', `bytes=${rangeStart}-`);xhr.onload = function () {if (this.status === 200 || this.status === 206) {res(this.response);return;}rej(`xhr error: ${this.status} ${this.response}`)};xhr.send();})
}async function downloader(url, rangeStart = 0) {const blob = await sendXhrReq(url, rangeStart);console.log(blob); // type is Blobconst dataURI = await blobToDataURI(blob);// data:application/octet-stream;base64,const rawBase64Str = String(dataURI);const base64Str = rawBase64Str.substring(rawBase64Str.indexOf('base64,') + 7);console.log(rawBase64Str.substring(0, 100));console.log(base64Str); // 之后在浏览器控制台复制字符串,粘贴到 base64_str_m4s.txt
}downloader('<m4s file url>');

base64_str_to_m4s.py

import base64def main():with open('base64_str_m4s.txt', 'r', encoding='utf-8') as f_in:inp = f_in.read()data = base64.b64decode(inp)with open('1.mp3', 'wb') as f_out:f_out.write(data)if __name__ == '__main__':main()

福利:赠送mp3截取代码mp3_clip.py,使用的是moviepy

from moviepy.editor import AudioFileClip
import osdef clip_audio(fname, st, ed=None):audio = AudioFileClip(fname).subclip(st, ed)out_file_name = f'{os.path.splitext(fname)[0]}-out.mp3'audio.write_audiofile(out_file_name)def main():clip_audio('1.mp3', 3.5)if __name__ == '__main__':main()

参考资料

  1. blobToDataURI:https://www.cnblogs.com/Sherries/p/14840404.html

这篇关于【前端甜点】某视频网站的m4s视频/音频下载方案(20240420)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/922341

相关文章

C#高效实现在Word文档中自动化创建图表的可视化方案

《C#高效实现在Word文档中自动化创建图表的可视化方案》本文将深入探讨如何利用C#,结合一款功能强大的第三方库,实现在Word文档中自动化创建图表,为你的数据呈现和报告生成提供一套实用且高效的解决方... 目录Word文档图表自动化:为什么选择C#?从零开始:C#实现Word文档图表的基本步骤深度优化:C

HTML5的input标签的`type`属性值详解和代码示例

《HTML5的input标签的`type`属性值详解和代码示例》HTML5的`input`标签提供了多种`type`属性值,用于创建不同类型的输入控件,满足用户输入的多样化需求,从文本输入、密码输入、... 目录一、引言二、文本类输入类型2.1 text2.2 password2.3 textarea(严格

Python+FFmpeg实现视频自动化处理的完整指南

《Python+FFmpeg实现视频自动化处理的完整指南》本文总结了一套在Python中使用subprocess.run调用FFmpeg进行视频自动化处理的解决方案,涵盖了跨平台硬件加速、中间素材处理... 目录一、 跨平台硬件加速:统一接口设计1. 核心映射逻辑2. python 实现代码二、 中间素材处

SpringBoot返回文件让前端下载的几种方式

《SpringBoot返回文件让前端下载的几种方式》文章介绍了开发中文件下载的两种常见解决方案,并详细描述了通过后端进行下载的原理和步骤,包括一次性读取到内存和分块写入响应输出流两种方法,此外,还提供... 目录01 背景02 一次性读取到内存,通过响应输出流输出到前端02 将文件流通过循环写入到响应输出流

Python + Streamlit项目部署方案超详细教程(非Docker版)

《Python+Streamlit项目部署方案超详细教程(非Docker版)》Streamlit是一款强大的Python框架,专为机器学习及数据可视化打造,:本文主要介绍Python+St... 目录一、针对 Alibaba Cloud linux/Centos 系统的完整部署方案1. 服务器基础配置(阿里

SpringBoot+Vue3整合SSE实现实时消息推送功能

《SpringBoot+Vue3整合SSE实现实时消息推送功能》在日常开发中,我们经常需要实现实时消息推送的功能,这篇文章将基于SpringBoot和Vue3来简单实现一个入门级的例子,下面小编就和大... 目录前言先大概介绍下SSE后端实现(SpringBoot)前端实现(vue3)1. 数据类型定义2.

SpringSecurity中的跨域问题处理方案

《SpringSecurity中的跨域问题处理方案》本文介绍了跨域资源共享(CORS)技术在JavaEE开发中的应用,详细讲解了CORS的工作原理,包括简单请求和非简单请求的处理方式,本文结合实例代码... 目录1.什么是CORS2.简单请求3.非简单请求4.Spring跨域解决方案4.1.@CrossOr

使用MyBatis TypeHandler实现数据加密与解密的具体方案

《使用MyBatisTypeHandler实现数据加密与解密的具体方案》在我们日常的开发工作中,经常会遇到一些敏感数据需要存储,比如用户的手机号、身份证号、银行卡号等,为了保障数据安全,我们通常会对... 目录1. 核心概念:什么是 TypeHandler?2. 实战场景3. 代码实现步骤步骤 1:定义 E

Python实现繁体转简体功能的三种方案

《Python实现繁体转简体功能的三种方案》在中文信息处理中,繁体字与简体字的转换是一个常见需求,无论是处理港澳台地区的文本数据,还是开发面向不同中文用户群体的应用,繁简转换都是不可或缺的功能,本文将... 目录前言为什么需要繁简转换?python实现方案方案一:使用opencc库方案二:使用zhconv库

前端Visual Studio Code安装配置教程之下载、汉化、常用组件及基本操作

《前端VisualStudioCode安装配置教程之下载、汉化、常用组件及基本操作》VisualStudioCode是微软推出的一个强大的代码编辑器,功能强大,操作简单便捷,还有着良好的用户界面,... 目录一、Visual Studio Code下载二、汉化三、常用组件1、Auto Rename Tag2