某博专题

Python爬虫基础知识学习(以爬取某二手房数据、某博数据与某红薯(书)评论数据为例)

一、爬虫基础流程 爬虫的过程模块化,基本上可以归纳为以下几个步骤:1、分析网页URL:打开你想要爬取数据的网站,然后寻找真实的页面数据URL地址;2、请求网页数据:模拟请求网页数据,这里我们介绍requests库的使用;3、解析网页数据:根据请求获得的网页数据我们用不同的方式解析成我们需要用的数据(如果网页数据为html源码,我们用Beautiful Soup、xpath和re正则表达式三

Python爬虫实战(五):某博终篇之粉丝和关注者账号的爬取

追风赶月莫停留,平芜尽处是春山。 文章目录 追风赶月莫停留,平芜尽处是春山。一、网页分析二、接口分析url分析返回数据分析 三、编写代码获取数据保存数据完整代码 终于终于终于期末考试结束了,暑假集训也结束了,终于有时间来更新我的博客了!! 今天咱们来聊一聊关于微博粉丝和关注者账号的抓取。 依旧是使用新版微博,依旧是熟悉的女神迪丽热巴😍。 咱们先看粉丝 一、网页分