爬取火影人物能力值及其可视化(pyecharts,selenium库)实现

2023-10-29 14:40

本文主要是介绍爬取火影人物能力值及其可视化(pyecharts,selenium库)实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

昨天,我做了一个词频统计的小案例。然后,可视化做上瘾了。今天,我吃饭看火影的凯皇励志片段,我想要了解凯皇有多强,接着去网上百度,将凯皇的能力爬取下来,之后可视化出来。我也加入了我欣赏的几个角色,鸣人,我爱罗,佐助。来进行能力值可视化的对比,我发现凯皇确实很强!!

我现在仿佛听见柱间说:“代码!来啊!先上代码啊!!”。好的,上代码:

#encoding="utf-8"
#Author:Mr.Pan_学狂
#Finished_time:2021/3/11/23:43from selenium import webdriver#selenium库爬取信息
from pyecharts.charts import *#导入所有的图形
from pyecharts import options as opts#导入pyecharts的配置
import random
import timeoptions = webdriver.ChromeOptions()#配置chrome
options.add_argument('--headless')#将配置添加无头模式
options.add_argument('--disable-gpu')#关闭GPU
driver = webdriver.Chrome(options=options)#导入之前设置的配置class HY_Persons:#定义类,火影人物def __init__(self):#初始化函数self.kh = {}#创建凯皇的字典,存储凯皇的各项能力以及能力值self.wal = {}#创建我爱罗的字典,存储我爱罗的各项能力以及能力值self.zz = {}#创建佐助的字典,存储佐助的各项能力以及能力值self.mr = {}#创建鸣人的字典,存储鸣人的各项能力以及能力值def Request(self,url):#方便以后使用,一次创建,多次调用driver.get(url)#使用get请求页面url地址driver.implicitly_wait(random.randint(3, 5))#设置页面的隐式等待时间def spyder(self):#定义爬虫#凯皇,人物能力总和print("凯皇")url = 'https://baike.baidu.com/item/%E8%BF%88%E7%89%B9%E5%87%AF/4897951?fr=aladdin#3'#url地址HY_Persons.Request(self,url)#调用Request函数执行get请求,以及设置响应等待时间for num in range(1,10):#循环1到9次talent = driver.find_element_by_xpath('/html/body/div[4]/div[2]/div/div[2]/table[1]/tbody/tr[1]/th[{}]'.format(num)).text#使用格式化字符串的方法,将循环得到的数字加入的其中,使得数据不断更新talent_value = driver.find_element_by_xpath('/html/body/div[4]/div[2]/div/div[2]/table[1]/tbody/tr[2]/td['+str(num)+']/div').text#使用字符串拼接的方法,先将数字转换成字符串,再将字符串拼接起来。#print(talent)#打印能力的各项指标#print(talent_value)#打印能力值self.kh[talent] = talent_value#得到凯皇的各项能力以及能力值字典。print(self.kh)#打印字典time.sleep(random.randint(1,2))#爬取佐助,人物能力总和print('佐助')url2 = 'https://baike.baidu.com/item/%E5%AE%87%E6%99%BA%E6%B3%A2%E4%BD%90%E5%8A%A9/401898?fromtitle=%E4%BD%90%E5%8A%A9&fromid=286034#3'HY_Persons.Request(self,url2)number = 1for z in range(1,10):if z == 10:number = 0talent = driver.find_element_by_xpath('/html/body/div[4]/div[2]/div/div[2]/table[1]/tbody/tr[1]/th['+str(z+number)+']/div').texttalent_value = driver.find_element_by_xpath('/html/body/div[4]/div[2]/div/div[2]/table[1]/tbody/tr[4]/td['+str(z)+']/div').textself.zz[talent] = talent_valueprint(self.zz)time.sleep(random.randint(1,2))#爬取鸣人,人物能力总和print("鸣人")url3 = 'https://baike.baidu.com/item/%E6%BC%A9%E6%B6%A1%E9%B8%A3%E4%BA%BA/322717?fromtitle=%E9%B8%A3%E4%BA%BA&fromid=54086698'HY_Persons.Request(self,url3)for m in range(1,10):if m == 10:number = 0talent = driver.find_element_by_xpath('/html/body/div[4]/div[2]/div/div[2]/table[2]/tbody/tr[1]/th['+str(m+number)+']/div').texttalent_value = driver.find_element_by_xpath('/html/body/div[4]/div[2]/div/div[2]/table[2]/tbody/tr[4]/td['+str(m)+']/div').textself.mr[talent] = talent_valueprint(self.mr)self.mr['总计'] = '52'print(self.mr)time.sleep(random.randint(1,2))#爬取我爱罗,人物能力总和print("我爱罗")url4  = "https://baike.baidu.com/item/%E6%88%91%E7%88%B1%E7%BD%97/237248#2"HY_Persons.Request(self,url4)for w in range(1,10):if w == 10:number = 0talent = driver.find_element_by_xpath('/html/body/div[4]/div[2]/div/div[2]/table[1]/tbody/tr[1]/th['+str(w+number)+']/div').texttalent_value = driver.find_element_by_xpath('/html/body/div[4]/div[2]/div/div[2]/table[1]/tbody/tr[4]/td['+str(w)+']/div').textself.wal[talent] = talent_valueprint(self.wal)def Data_show(self):# dt = {"name": "", "max": "10", "min": "0"}# data_schema = []# for d in self.zz.keys():#     dt["name"] = d#     print(dt)#     data_schema.append(dt)# print(data_schema)kh = []zz = []mr = []wal = []self.kh['智力']=10#将智力和力量的值互换,保证跟后面的数据一致性self.kh['力量']=6#是可视化的数据是正确的for d in self.kh.values():#凯皇的能力值kh.append(d)value_kh = [kh]#存储凯皇能力值print(value_kh)for z in self.zz.values():#佐助的能力值zz.append(z)#存储佐助的能力值value_zz = [zz]for m in self.mr.values():#鸣人的能力值mr.append(m)#存储鸣人的能力值value_mr = [mr]for w in self.wal.values():#我爱罗的能力值wal.append(w)#存储我爱罗的能力值value_wal = [wal]data_schema = [{"name":"忍术","max":"10","min":"0"},#雷达图的各个能力数据。{"name":"体术","max":"10","min":"0"},{"name":"幻术","max":"10","min":"0"},{"name":"智慧","max":"10","min":"0"},{"name":"力量","max":"10","min":"0"},{"name":"速度","max":"10","min":"0"},{"name":"查克拉","max":"10","min":"0"},{"name":"结印","max":"10","min":"0"},{"name":"总计","max":"80","min":"0"}]Rdr = (Radar().add_schema(schema=data_schema,shape="circle").add("凯皇",value_kh,color="#DC143C")#设置红色.add("佐助",value_zz,color="#9400D3")#设置紫色.add("鸣人",value_mr,color="#FFA500")#设置橘黄色.add("我爱罗",value_wal,color="#4fa5e1")#设置蓝色.set_series_opts(label_opts=opts.LabelOpts(is_show=False)).set_global_opts(title_opts=opts.TitleOpts(title="火影人物可视化")#设置标题).render('F:/Radar.html')#另存为F盘下面)
if __name__ == '__main__':#定义主函数,程序入口HY = HY_Persons()#实例化对象HY.spyder()#调用函数HY.Data_show()#调用函数,可视化

代码的解释在注释中有了,不懂的朋友可以私信我一起探讨。
运行结果,如下图:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
第一次做雷达图,没有经验,感觉很好看。后续有时间,会再做可视化的案例。
最后,感谢大家前来观看鄙人的文章,文中或有诸多不妥之处,还望指出和海涵。

这篇关于爬取火影人物能力值及其可视化(pyecharts,selenium库)实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/301321

相关文章

使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)

《使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)》在现代软件开发中,处理JSON数据是一项非常常见的任务,无论是从API接口获取数据,还是将数据存储为JSON格式,解析... 目录1. 背景介绍1.1 jsON简介1.2 实际案例2. 准备工作2.1 环境搭建2.1.1 添加

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

java如何分布式锁实现和选型

《java如何分布式锁实现和选型》文章介绍了分布式锁的重要性以及在分布式系统中常见的问题和需求,它详细阐述了如何使用分布式锁来确保数据的一致性和系统的高可用性,文章还提供了基于数据库、Redis和Zo... 目录引言:分布式锁的重要性与分布式系统中的常见问题和需求分布式锁的重要性分布式系统中常见的问题和需求

SpringBoot基于MyBatis-Plus实现Lambda Query查询的示例代码

《SpringBoot基于MyBatis-Plus实现LambdaQuery查询的示例代码》MyBatis-Plus是MyBatis的增强工具,简化了数据库操作,并提高了开发效率,它提供了多种查询方... 目录引言基础环境配置依赖配置(Maven)application.yml 配置表结构设计demo_st

python使用watchdog实现文件资源监控

《python使用watchdog实现文件资源监控》watchdog支持跨平台文件资源监控,可以检测指定文件夹下文件及文件夹变动,下面我们来看看Python如何使用watchdog实现文件资源监控吧... python文件监控库watchdogs简介随着Python在各种应用领域中的广泛使用,其生态环境也

el-select下拉选择缓存的实现

《el-select下拉选择缓存的实现》本文主要介绍了在使用el-select实现下拉选择缓存时遇到的问题及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录项目场景:问题描述解决方案:项目场景:从左侧列表中选取字段填入右侧下拉多选框,用户可以对右侧

Python pyinstaller实现图形化打包工具

《Pythonpyinstaller实现图形化打包工具》:本文主要介绍一个使用PythonPYQT5制作的关于pyinstaller打包工具,代替传统的cmd黑窗口模式打包页面,实现更快捷方便的... 目录1.简介2.运行效果3.相关源码1.简介一个使用python PYQT5制作的关于pyinstall

使用Python实现大文件切片上传及断点续传的方法

《使用Python实现大文件切片上传及断点续传的方法》本文介绍了使用Python实现大文件切片上传及断点续传的方法,包括功能模块划分(获取上传文件接口状态、临时文件夹状态信息、切片上传、切片合并)、整... 目录概要整体架构流程技术细节获取上传文件状态接口获取临时文件夹状态信息接口切片上传功能文件合并功能小

python实现自动登录12306自动抢票功能

《python实现自动登录12306自动抢票功能》随着互联网技术的发展,越来越多的人选择通过网络平台购票,特别是在中国,12306作为官方火车票预订平台,承担了巨大的访问量,对于热门线路或者节假日出行... 目录一、遇到的问题?二、改进三、进阶–展望总结一、遇到的问题?1.url-正确的表头:就是首先ur

C#实现文件读写到SQLite数据库

《C#实现文件读写到SQLite数据库》这篇文章主要为大家详细介绍了使用C#将文件读写到SQLite数据库的几种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以参考一下... 目录1. 使用 BLOB 存储文件2. 存储文件路径3. 分块存储文件《文件读写到SQLite数据库China编程的方法》博客中,介绍了文