首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
20161206专题
Python 2.7_First_try_爬取阳光电影网_20161206
之前看过用Scrapy 框架建立项目爬取 网页解析时候用的Xpath进行解析的网页元素 这次尝试用select方法匹配元素 1、入口爬取页面 http://www.ygdy8.com/index.html 2、用到模块 requests(网页源码下载) BeautifulSoup4(网页解析) 3、思路:首先由入口爬取页面进行获取网页上方栏目及对应url 如下图 4、建立菜单url列表 for
阅读更多...