歌谱简谱网的小爬虫,用着贼爽!

2024-02-04 19:20
文章标签 简谱 歌谱 小爬虫

本文主要是介绍歌谱简谱网的小爬虫,用着贼爽!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

歌谱简谱网的乐谱,一个一个下载感兴趣的歌谱图片费时费力,没有效率,很不痛快。

干脆弄条爬虫,喜欢哪首乐谱,就把乐谱所在的网址粘贴进去,就行啦,爬虫帮你自动建立文件夹下载到本地,用着贼爽!

网站地址:http://www.yidianqiuxun.com
在这里插入图片描述
具体代码如下:

import re
import os
import requests
'''
使用方法:
代码复制到py文件中,保存,关闭,双击键入感兴趣的乐谱网址,即可下载
网址主页:http://www.yidianqiuxun.com学到的技能:
1.用re.sub('pattern','',title) 方法,处理文件名中非法字符
2.多种情况的模式匹配处理方法疑问:有没有高端的方法呢?'''headers = {"User-Agent":"Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}def filename_filter(title):  ''' windows系统中文件名不能包含 \ / : * ? " < > |想要创建必须过滤掉这些字符 '''title = re.sub('[\/:*?"<>|]','',title)return titledef max_list(img_url_a,img_url_b,img_url_c):'''筛选出有效列表'''list_all = [img_url_a,img_url_b,img_url_c]max_num = max(len(img_url_a),len(img_url_b),len(img_url_c))for listx in list_all:if len(listx) == max_num:return listxdef download(url,title):print('正在下载:{}\n图片网址为:{}'.format(title.split('/')[-1],url))img_data = requests.get(url,headers=headers).contentwith open(title,'wb') as f:f.write(img_data)print('-'*65)def main():while True:url = input("\n还需要下载请输入歌谱网址(退出请输入q):")# url = 'http://www.yidianqiuxun.com/164713.html'if url == 'q':breakelse:# url = 'http://www.yidianqiuxun.com/164713.html'res = requests.get(url,headers=headers).text# print(res)#匹配标题titlepat1 = r'<h1 class="entry-title">(.*?)</h1>'title = re.compile(pat1).findall(res)[0]title = filename_filter(title)print('本乐谱名字为:',title)print('='*70)path = os.getcwd() + '/' + titleif not os.path.exists(path):os.makedirs(path)# 第1种情况pata = r'<img class="align.*?size-full wp-image-.*?" src="(http.*?)" alt="'img_url_a = re.compile(pata).findall(res) # 第2种情况patb = r'<img alt=".*?src="(http.*?)"'img_url_b = re.compile(patb).findall(res) # 第3种情况patc = r'<img src="(http.*?)" alt=".*?"  border=".*?"'img_url_c = re.compile(patc).findall(res) # 筛选出有数据的列表    http://www.yidianqiuxun.com/22123.htmlimg_url = max_list(img_url_a,img_url_b,img_url_c)print(img_url)# 遍历并下载乐谱图片for i in range(len(img_url)):try:url_tail = img_url[i].split('.')[-1]title_jianpu = path + '/' + title + str(i+1).rjust(2,'0') + '.' + url_tail download(img_url[i],title_jianpu)except Exception as e:print(e)continueprint('下载结束:《{}》'.format(title))print('=*='*38)if __name__ == '__main__':main()

这篇关于歌谱简谱网的小爬虫,用着贼爽!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/678551

相关文章

一个小爬虫

长安大学招生情况分析 一直对爬虫和数据分析感兴趣,最近刚刚也找到一份工作,可以好好来做这件事了。 爬虫部分 2016/10/22 从上学期想自己写一个通过模拟登录来查成绩的程序说起吧。 初衷是因为每次查成绩需要去学校的信息门户查,而信息门户里面的查成绩系统兼容性差的老火的很,只支持古老的IE6,于是每次都需要切换到兼容模式,严重的时候还得到虚拟机用XP = =。所以萌生了模拟登录信息

JP-Word 简谱编辑(JPW简谱)打谱软件免费版下载 WiN

Windows | 20M JP-Word简谱编辑软件(简称JPW简谱软件)是一款专业的简谱编辑排版软件,操作方式如同在Word中打字,所见即所得,独创的“切换音符时值组合”功能,输入速度快捷高效!无论歌谱、戏曲谱、合唱谱乃至器乐谱,均可轻松应对。生成的乐谱规范精美,高质量的输出可用于书籍出版。乐谱可播放,也可导出为MIDI文件,甚至还可以生成mp3/mp4,制作动态乐谱!。 JPW简谱软

Ziipoo(易谱)简谱编辑制作打谱软件免费版下载 WiN+MAC+安卓+Linux

更新说明: 最新版更新说明[2491版,2021-05-30日更新] 2474版开始支持原生的ARM芯片mac(M1芯片的mac) 2440版开始linux支持内置浏览器功能和mac/win平台同步。 2429版开始支持多文档及重做功能。 2362版开始提供原生linux版。 2346版开始支持内部浏览器。 2328版开始支持soundfont音色。 2314版开始支持快音输入法插件,可以提

C语言,实现数字谱到简谱的转换(二)

C语言,实现数字谱到简谱的转换(二) 前言:本文初编辑于2024年5月8日 CSDN:https://blog.csdn.net/rvdgdsva 博客园:https://www.cnblogs.com/hassle 前言 结合前文使用 之前的程序默认C调4/4拍,自己用的很难受,很多时候还是需要自己分节,节奏分得很清楚反而很难看清了 这一版程序保留了数字谱原有的分行,同时直

吉他弹唱谱怎么制作 Guitar Pro 怎么写弹简谱 Guitar Pro8.02简谱

学习如何制作吉他弹唱谱是提升音乐创作和表现能力的重要一环。借助专业的软件工具如Guitar Pro,可以轻松地将音乐创意转化为可视化的乐谱,使演奏和分享变得更加便捷和高效。下面我们来看看吉他弹唱谱怎么制作,Guitar Pro 怎么写弹简谱的相关内容。 在开始之前,如果你没有Guitar Pro8这款软件,可以点击下方链接一键安装: Guitar Pro 8 mac-安装包免费下载:https

Python 小爬虫:爬取 bing 每日壁纸设为桌面壁纸

请求 URLJSON 版示例代码代码片段注意点headers 中的 User-Agent响应头中的 Content-Type终端通过代理 API从 bing.com 找Bing 每日壁纸设置为桌面壁纸代码设定计划任务自动执行 python 脚本 请求 URL 通过模仿必应(Bing)自己的 AJAX 调用方式获得请求 URL。 JSON 格式:

用计算机弹欧若拉数字,欧若拉钢琴简谱-数字双手-张韶涵

欧若拉钢琴简谱歌词 神秘北极圈 阿拉斯加的山巅 谁的脸   出现海角的天边 忽然的瞬间  在那遥远的地点 我看见   恋人幸福的光点 灵魂在召唤  唱着古老 陌生熟悉的歌谣  天空在微笑 我的世界缤纷闪耀 爱是一道光  如此美妙 指引我们   想要的未来 魔力北极光  奇幻的预言 赶快去找不思议的爱 爱是一道光  如此美妙 照亮我们   勇气的未来 魔力北极光  传说的预言 原来就是

使用Word制作歌谱在Kindle上显示

前言 近来室友帮忙入手了一部kindle,想在kindle上显示歌谱,于是在网上各种百度,尝试制作。现总结如下: jpg图片转换pdf 百度搜索jpg转换pdf,选择一个免费在线转换pdf,转换完成后下载保存待用。 pdf尺寸修改 保存下来的文件,使用Word打开,调整纸张大小为6寸,即宽9cm,高11.7cm。完成之后再次调整图片显示,放到kindle即可 结果

5分钟从零开始构建一个Node.js小爬虫程序并生成网站

通过RSS2JSON和Node.js设计一个简单的小爬虫 阅读这篇blog大约需要5分钟 之前我们学习了解了很多Node.js、云部署的基础知识,今天通过一个小爬虫练习实践一下,你会发现从零开始构建一个小爬虫超级简单和方便。主要会涉及到这些知识点: 通过RSS2JSON将rss转化为json格式MUI CSS设计极简风格Node.js异步编程axios模块cheerio模块通过heroku上

node.js学习笔记--HTTP之Promise重写小爬虫

注:此博客是在学习进击Node.js基础(一)这门课程时的学习笔记,感谢Scott老师的课程。 一、使用Promise处理异步、嵌套 1. 用传统的回调来按顺序执行小球动画 <!doctype><html><head><title>Promise animation</title><style>.ball{width: 40px;height:40px;border-radius: 20