zhai男福利!Python爬取猫耳FM音频,一场酣畅淋漓的听觉盛宴!!!

2024-02-12 15:10

本文主要是介绍zhai男福利!Python爬取猫耳FM音频,一场酣畅淋漓的听觉盛宴!!!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

前言

本文知识点

 环境与库

 实现步骤

代码实现 

导入相关模块

解析网页

获取音频id

解析json数据获取音频下载链接

下载保存并命名

函数整体调用

最终效果展示


前言

猫耳FM一般被称作“M站”,平台内容以女性向为主,覆盖了有声漫、广播剧、翻唱、电台等二次元及泛二次元的声音内容,是一个专注于ACG相关内容的二次元音频社区。

今天,它将是我们的受害者○( ^皿^)っHiahiahia…

本文知识点

  • 1、函数构造与调用
  • 2、多层数据解析
  • 3、海量音频数据保存

 环境与库

  • python 3.8
  • pycharm专业版
  • requests
  • re
  • os

 实现步骤

  • 1.获取每个音频的id
  • 2.通过id拼接音频详情页地址
  • 3.请求地址获取json数据
  • 4.解析json数据获取音频地址
  • 5.保存音频并以其名称命名

代码实现 

导入相关模块

import requests
import re
import os

解析网页

def get_html(url):headers = {'Cookie': 'acw_tc=2f624a5917044582169955929e19a14ec0e690ecccc374f6f37cab9d2758df; MSESSID=4efr9ap4gadb2s08pdiq129q73; Hm_lvt_91a4e950402ecbaeb38bd149234eb7cc=1704458226; Hm_lpvt_91a4e950402ecbaeb38bd149234eb7cc=1704458285','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'}response = requests.get(url, headers=headers)return response

获取音频id

网页右键查看网页源代码找到音频详情页地址,并使用re正则解析出其id

def get_ids(response):mp3_ids = re.findall('<a target="_player" href="/sound/(.*?)" title=".*?">', response.text)return mp3_ids

解析json数据获取音频下载链接

def get_sound(response):json_data = response.json()title = json_data['info']['sound']['soundstr']  # 标题sound_url = json_data['info']['sound']['soundurl']  # 音频下载链接return title, sound_url

下载保存并命名

def save(title, mp3_data):with open('mp3\\' + title + '.m4a', mode='wb') as f:f.write(mp3_data)print(title, '下载完成!')

函数整体调用


def run(url):response = get_html(url)mp3_ids = get_ids(response)for mp3_id in mp3_ids:mp3_url = 'https://www.missevan.com/sound/getsound?soundid=' + mp3_idresponse_1 = get_html(mp3_url)title, sound_url = get_sound(response_1)# title = change_title(title)# print(sound_url)mp3_data = get_html(sound_url).contentsave(title, mp3_data)run('https://www.missevan.com/sound/m/110')

最终效果展示

什么?!当女友假装病娇对你用手铐,发现弄疼你后道歉 。好好好,今晚就梦这个!!!

这篇关于zhai男福利!Python爬取猫耳FM音频,一场酣畅淋漓的听觉盛宴!!!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/702854

相关文章

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v

Python使用python-can实现合并BLF文件

《Python使用python-can实现合并BLF文件》python-can库是Python生态中专注于CAN总线通信与数据处理的强大工具,本文将使用python-can为BLF文件合并提供高效灵活... 目录一、python-can 库:CAN 数据处理的利器二、BLF 文件合并核心代码解析1. 基础合

Python使用OpenCV实现获取视频时长的小工具

《Python使用OpenCV实现获取视频时长的小工具》在处理视频数据时,获取视频的时长是一项常见且基础的需求,本文将详细介绍如何使用Python和OpenCV获取视频时长,并对每一行代码进行深入解析... 目录一、代码实现二、代码解析1. 导入 OpenCV 库2. 定义获取视频时长的函数3. 打开视频文

Python中你不知道的gzip高级用法分享

《Python中你不知道的gzip高级用法分享》在当今大数据时代,数据存储和传输成本已成为每个开发者必须考虑的问题,Python内置的gzip模块提供了一种简单高效的解决方案,下面小编就来和大家详细讲... 目录前言:为什么数据压缩如此重要1. gzip 模块基础介绍2. 基本压缩与解压缩操作2.1 压缩文

Python设置Cookie永不超时的详细指南

《Python设置Cookie永不超时的详细指南》Cookie是一种存储在用户浏览器中的小型数据片段,用于记录用户的登录状态、偏好设置等信息,下面小编就来和大家详细讲讲Python如何设置Cookie... 目录一、Cookie的作用与重要性二、Cookie过期的原因三、实现Cookie永不超时的方法(一)

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客

Python函数作用域示例详解

《Python函数作用域示例详解》本文介绍了Python中的LEGB作用域规则,详细解析了变量查找的四个层级,通过具体代码示例,展示了各层级的变量访问规则和特性,对python函数作用域相关知识感兴趣... 目录一、LEGB 规则二、作用域实例2.1 局部作用域(Local)2.2 闭包作用域(Enclos

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四