python 爬虫 爬取腾讯较真查证平台,对新型冠状病毒“谣言”的新闻进行数据分析

本文主要是介绍python 爬虫 爬取腾讯较真查证平台,对新型冠状病毒“谣言”的新闻进行数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

'''
python 爬虫  爬取腾讯较真查证平台,对新型冠状病毒“谣言”的新闻进行数据分析
http://www.cppcns.com/jiaoben/python/300617.html
Authon: taotao
Date:20200227'''import requests
import pandas
class SpiderRumor(object):def __init__(self):self.url = "https://vp.fact.qq.com/loadmore?artnum=0&page=%s"self.header = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3269.3 Safari/537.36"}def Run_spider(self):df_all = list()for url in [self.url % i for i in range(40)]:data_list = requests.get(url, headers = self.header).json()["content"]print(data_list)tempdata = [[df["title"], df["date"], df["result"], df["explain"], df["tag"]] for df in data_list]# print(tempdata)df_all.extend(tempdata)# 生成Excel表pd = pandas.DataFrame(df_all, columns=["title", "date", "result", "explain", "tag"]).to_csv("关于新冠状病毒的谣言统计表.csv", encoding="utf_8_sig")# 程序过程if __name__ == '__main__':spider = SpiderRumor()spider.Run_spider()

 

'''
python 爬虫  爬取腾讯较真查证平台,对新型冠状病毒“谣言”的新闻进行数据分析
生成一个饼状图
http://www.cppcns.com/jiaoben/python/300617.html
Autor: taotao
Date: 20200227'''import matplotlib.pyplot
import pandas# windos系统设置中文字体
matplotlib.pyplot.rcParams['font.sans-serif'] = ['SimHei']  #  用来显示中文标签
matplotlib.pyplot.rcParams['axes.unicode_minus'] = False
data = pandas.read_csv("F:/python_program/20200227/关于新冠状病毒的谣言统计表.csv")
# print(data)
labels = data["explain"].value_counts().index.tolist()
print(labels)
sizes = data["explain"].value_counts().values.tolist()
print(sizes)
# colorsmatplotlib.pyplot.figure(figsize=(8, 8))
matplotlib.pyplot.pie(sizes, labels = labels, autopct = '%1.1f%%', shadow = True, startangle= 0)matplotlib.pyplot.axis("equal")
matplotlib.pyplot.show()# lables = data[]

 

 

这篇关于python 爬虫 爬取腾讯较真查证平台,对新型冠状病毒“谣言”的新闻进行数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/820749

相关文章

Python xmltodict实现简化XML数据处理

《Pythonxmltodict实现简化XML数据处理》Python社区为提供了xmltodict库,它专为简化XML与Python数据结构的转换而设计,本文主要来为大家介绍一下如何使用xmltod... 目录一、引言二、XMLtodict介绍设计理念适用场景三、功能参数与属性1、parse函数2、unpa

Python中使用defaultdict和Counter的方法

《Python中使用defaultdict和Counter的方法》本文深入探讨了Python中的两个强大工具——defaultdict和Counter,并详细介绍了它们的工作原理、应用场景以及在实际编... 目录引言defaultdict的深入应用什么是defaultdictdefaultdict的工作原理

Python中@classmethod和@staticmethod的区别

《Python中@classmethod和@staticmethod的区别》本文主要介绍了Python中@classmethod和@staticmethod的区别,文中通过示例代码介绍的非常详细,对大... 目录1.@classmethod2.@staticmethod3.例子1.@classmethod

Python手搓邮件发送客户端

《Python手搓邮件发送客户端》这篇文章主要为大家详细介绍了如何使用Python手搓邮件发送客户端,支持发送邮件,附件,定时发送以及个性化邮件正文,感兴趣的可以了解下... 目录1. 简介2.主要功能2.1.邮件发送功能2.2.个性签名功能2.3.定时发送功能2. 4.附件管理2.5.配置加载功能2.6.

使用Python进行文件读写操作的基本方法

《使用Python进行文件读写操作的基本方法》今天的内容来介绍Python中进行文件读写操作的方法,这在学习Python时是必不可少的技术点,希望可以帮助到正在学习python的小伙伴,以下是Pyth... 目录一、文件读取:二、文件写入:三、文件追加:四、文件读写的二进制模式:五、使用 json 模块读写

Python使用qrcode库实现生成二维码的操作指南

《Python使用qrcode库实现生成二维码的操作指南》二维码是一种广泛使用的二维条码,因其高效的数据存储能力和易于扫描的特点,广泛应用于支付、身份验证、营销推广等领域,Pythonqrcode库是... 目录一、安装 python qrcode 库二、基本使用方法1. 生成简单二维码2. 生成带 Log

Python如何使用seleniumwire接管Chrome查看控制台中参数

《Python如何使用seleniumwire接管Chrome查看控制台中参数》文章介绍了如何使用Python的seleniumwire库来接管Chrome浏览器,并通过控制台查看接口参数,本文给大家... 1、cmd打开控制台,启动谷歌并制定端口号,找不到文件的加环境变量chrome.exe --rem

一文带你理解Python中import机制与importlib的妙用

《一文带你理解Python中import机制与importlib的妙用》在Python编程的世界里,import语句是开发者最常用的工具之一,它就像一把钥匙,打开了通往各种功能和库的大门,下面就跟随小... 目录一、python import机制概述1.1 import语句的基本用法1.2 模块缓存机制1.

使用zabbix进行监控网络设备流量

《使用zabbix进行监控网络设备流量》这篇文章主要为大家详细介绍了如何使用zabbix进行监控网络设备流量,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录安装zabbix配置ENSP环境配置zabbix实行监控交换机测试一台liunx服务器,这里使用的为Ubuntu22.04(

使用Python将长图片分割为若干张小图片

《使用Python将长图片分割为若干张小图片》这篇文章主要为大家详细介绍了如何使用Python将长图片分割为若干张小图片,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. python需求的任务2. Python代码的实现3. 代码修改的位置4. 运行结果1. Python需求