嗅教专题

前嗅教你大数据:采集带有翻页结构的网页数据

置顶 “前嗅大数据” 和数据大牛一起成长,做牛气哄哄的大数据人 【场景描述】采集带有翻页的网页中的数据。 【使用工具】前嗅ForeSpider数据采集系统,免费下载: ForeSpider免费版本下载地址 【教程说明】 采集带有翻页的网站,需要先获取所有的翻页链接,常见的翻页链接有三种:数字翻页、点击加载更多/下一页、瀑布流翻页。接下来将为大家介绍不同翻页的配置方法。

前嗅教你大数据:采集孔夫子旧书网

l 采集网站 【场景描述】采集孔夫子旧书网数据。 【源网站介绍】孔夫子旧书网是国内专业的古旧书交易平台,汇集全国各地13000家网上书店,50000家书摊,展示多达9000万种书籍;大量极具收藏价值的古旧珍本(明清、民国古籍善本,珍品期刊,名人墨迹,民国珍本,绝版书等)在孔网展示与交易,吸引了大量的学者、研究人员和藏书人长时间在线关注并参与。 【使用工具】前嗅ForeSpider数据采集系统