利用八爪鱼实现拉取网站文章并推送到数据库(免费版本),适合小白

本文主要是介绍利用八爪鱼实现拉取网站文章并推送到数据库(免费版本),适合小白,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

尝试过火车头,太过于复杂,对新手不太友好,试过八爪鱼后感觉还不错,比较适合新手

1.下载安装八爪鱼,注册账号,登录

下载链接:

https://www.bazhuayu.com/

登录进去是这样:

在开始采集处输入要拉文章的链接

我这里以如下网站为例

https://mp.ofweek.com/ctrade/fiber/

 点击开始采集,左边为流程图,右侧为网页,点击网页内的链接按照右上角的提示提取文章标题和链接(点击时会提示选中相同元素,如果需要批量下载就点击)

 这时我发现文章的标题很多,需要翻页不断加载,如果只提取这几个显然不够用,需要添加翻页循环操作,点击这里,选择循环

 

 点击 循环列表右上角的设置,设置循环翻页,点击应用,最后记得把刚才设置提取文章标题的循环拖动到循环翻页的内部

 这时已经设置好了循环翻页提取文章标题和链接了,下面提取文章内容,点击右侧采集下一集网

选择从采集的字段里跳转到文章内容里,依次点击标题,采集;时间,采集;正文,采集

(这里要注意,如果要一次性选中全文内容的话需要点击正文后选择一下右下角最右边的DIV,然后点击提取该元素)

 再点击左上角,采集,启动本地采集(定时和云都是要付费的) ,下面 是采集结果,点击导入,导入到mysql中即可,注意字符编码是UTF-8,文章的字符类型设定为longtxt,导入即可       

 

有问题可以联系我沟通下~ 

 

 

 

 

 

 

这篇关于利用八爪鱼实现拉取网站文章并推送到数据库(免费版本),适合小白的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/250915

相关文章

Spring Security自定义身份认证的实现方法

《SpringSecurity自定义身份认证的实现方法》:本文主要介绍SpringSecurity自定义身份认证的实现方法,下面对SpringSecurity的这三种自定义身份认证进行详细讲解,... 目录1.内存身份认证(1)创建配置类(2)验证内存身份认证2.JDBC身份认证(1)数据准备 (2)配置依

利用python实现对excel文件进行加密

《利用python实现对excel文件进行加密》由于文件内容的私密性,需要对Excel文件进行加密,保护文件以免给第三方看到,本文将以Python语言为例,和大家讲讲如何对Excel文件进行加密,感兴... 目录前言方法一:使用pywin32库(仅限Windows)方法二:使用msoffcrypto-too

C#使用StackExchange.Redis实现分布式锁的两种方式介绍

《C#使用StackExchange.Redis实现分布式锁的两种方式介绍》分布式锁在集群的架构中发挥着重要的作用,:本文主要介绍C#使用StackExchange.Redis实现分布式锁的... 目录自定义分布式锁获取锁释放锁自动续期StackExchange.Redis分布式锁获取锁释放锁自动续期分布式

springboot使用Scheduling实现动态增删启停定时任务教程

《springboot使用Scheduling实现动态增删启停定时任务教程》:本文主要介绍springboot使用Scheduling实现动态增删启停定时任务教程,具有很好的参考价值,希望对大家有... 目录1、配置定时任务需要的线程池2、创建ScheduledFuture的包装类3、注册定时任务,增加、删

SpringBoot整合mybatisPlus实现批量插入并获取ID详解

《SpringBoot整合mybatisPlus实现批量插入并获取ID详解》这篇文章主要为大家详细介绍了SpringBoot如何整合mybatisPlus实现批量插入并获取ID,文中的示例代码讲解详细... 目录【1】saveBATch(一万条数据总耗时:2478ms)【2】集合方式foreach(一万条数

使用Python实现矢量路径的压缩、解压与可视化

《使用Python实现矢量路径的压缩、解压与可视化》在图形设计和Web开发中,矢量路径数据的高效存储与传输至关重要,本文将通过一个Python示例,展示如何将复杂的矢量路径命令序列压缩为JSON格式,... 目录引言核心功能概述1. 路径命令解析2. 路径数据压缩3. 路径数据解压4. 可视化代码实现详解1

PyQt6/PySide6中QTableView类的实现

《PyQt6/PySide6中QTableView类的实现》本文主要介绍了PyQt6/PySide6中QTableView类的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学... 目录1. 基本概念2. 创建 QTableView 实例3. QTableView 的常用属性和方法

PyQt6/PySide6中QTreeView类的实现

《PyQt6/PySide6中QTreeView类的实现》QTreeView是PyQt6或PySide6库中用于显示分层数据的控件,本文主要介绍了PyQt6/PySide6中QTreeView类的实现... 目录1. 基本概念2. 创建 QTreeView 实例3. QTreeView 的常用属性和方法属性

Android使用ImageView.ScaleType实现图片的缩放与裁剪功能

《Android使用ImageView.ScaleType实现图片的缩放与裁剪功能》ImageView是最常用的控件之一,它用于展示各种类型的图片,为了能够根据需求调整图片的显示效果,Android提... 目录什么是 ImageView.ScaleType?FIT_XYFIT_STARTFIT_CENTE

pandas中位数填充空值的实现示例

《pandas中位数填充空值的实现示例》中位数填充是一种简单而有效的方法,用于填充数据集中缺失的值,本文就来介绍一下pandas中位数填充空值的实现,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是中位数填充?为什么选择中位数填充?示例数据结果分析完整代码总结在数据分析和机器学习过程中,处理缺失数