【R语言爬虫】网贷天眼数据平台表格数据抓取2

2024-09-07 07:38

本文主要是介绍【R语言爬虫】网贷天眼数据平台表格数据抓取2,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、需求分析
抓取url:
http://www.p2peye.com/shuju/ptsj/
昨日数据:
字段:排序 平台名称 成交额 综合利率 投资人 借款周期 借款人 满标速度 累计贷款余额 资金净流入

这里写图片描述

二、rvest爬虫实现源代码

rm(list=ls())
gc()
options(scipen = 200)
library('rvest')
timestart<-Sys.time()url="http://www.p2peye.com/shuju/ptsj/"#从网站中读取HTML代码
webpage <- read_html(url)#使用CSS选择器来爬取排名部分
rank_data_html <- html_nodes(webpage,'.num')
#将排名数据转化为文本
rank_data <- html_text(rank_data_html)
#数据预处理:将排名转换为数字格式
rank_data<-as.numeric(rank_data[2:length(rank_data)])name <- html_nodes(webpage,'.name')
name_data <- html_text(name[2:length(name)])
#数据预处理:去掉'\n'
name_data<-gsub("\n","",name_data)
#数据预处理:去掉多余的空格
name_data<-gsub(" ","",name_data)total <- html_nodes(webpage,'.total')
total_data <- html_text(total[2:length(total)])rate <- html_nodes(webpage,'.rate')
rate_data <- html_text(rate[2:length(rate)])pnum <- html_nodes(webpage,'.pnum')
pnum_data <- html_text(pnum[2:length(pnum)])cycle <- html_nodes(webpage,'.cycle')
cycle_data <- html_text(cycle[2:length(cycle)])p1num <- html_nodes(webpage,'.p1num')
p1num_data <- html_text(p1num[2:length(p1num)])fuload <- html_nodes(webpage,'.fuload')
fuload_data <- html_text(fuload[2:length(fuload)])alltotal <- html_nodes(webpage,'.alltotal')
alltotal_data <- html_text(alltotal[2:length(alltotal)])capital <- html_nodes(webpage,'.capital')
capital_data <- html_text(capital[2:length(capital)])data <- data.frame("排序"=rank_data,"平台名称"=name_data,"成交额"=total_data,"综合利率"=rate_data,"投资人"=pnum_data,"借款周期"=cycle_data,"借款人"=pnum_data,"满标速度"=fuload_data,"累计贷款余额"=alltotal_data,"资金净流入"=capital_data)###############写出数据到excel
library(xlsx)
write.xlsx(data,"C:\\mydata.xlsx",row.names = F)  
timeend<-Sys.time()
runningtime<-timeend-timestart
print(runningtime) 

这里写图片描述

这里写图片描述

这篇关于【R语言爬虫】网贷天眼数据平台表格数据抓取2的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1144466

相关文章

MySQL 中查询 VARCHAR 类型 JSON 数据的问题记录

《MySQL中查询VARCHAR类型JSON数据的问题记录》在数据库设计中,有时我们会将JSON数据存储在VARCHAR或TEXT类型字段中,本文将详细介绍如何在MySQL中有效查询存储为V... 目录一、问题背景二、mysql jsON 函数2.1 常用 JSON 函数三、查询示例3.1 基本查询3.2

SpringBatch数据写入实现

《SpringBatch数据写入实现》SpringBatch通过ItemWriter接口及其丰富的实现,提供了强大的数据写入能力,本文主要介绍了SpringBatch数据写入实现,具有一定的参考价值,... 目录python引言一、ItemWriter核心概念二、数据库写入实现三、文件写入实现四、多目标写入

使用Python将JSON,XML和YAML数据写入Excel文件

《使用Python将JSON,XML和YAML数据写入Excel文件》JSON、XML和YAML作为主流结构化数据格式,因其层次化表达能力和跨平台兼容性,已成为系统间数据交换的通用载体,本文将介绍如何... 目录如何使用python写入数据到Excel工作表用Python导入jsON数据到Excel工作表用

Mysql如何将数据按照年月分组的统计

《Mysql如何将数据按照年月分组的统计》:本文主要介绍Mysql如何将数据按照年月分组的统计方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql将数据按照年月分组的统计要的效果方案总结Mysql将数据按照年月分组的统计要的效果方案① 使用 DA

Go 语言中的select语句详解及工作原理

《Go语言中的select语句详解及工作原理》在Go语言中,select语句是用于处理多个通道(channel)操作的一种控制结构,它类似于switch语句,本文给大家介绍Go语言中的select语... 目录Go 语言中的 select 是做什么的基本功能语法工作原理示例示例 1:监听多个通道示例 2:带

鸿蒙中Axios数据请求的封装和配置方法

《鸿蒙中Axios数据请求的封装和配置方法》:本文主要介绍鸿蒙中Axios数据请求的封装和配置方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1.配置权限 应用级权限和系统级权限2.配置网络请求的代码3.下载在Entry中 下载AxIOS4.封装Htt

在Android平台上实现消息推送功能

《在Android平台上实现消息推送功能》随着移动互联网应用的飞速发展,消息推送已成为移动应用中不可或缺的功能,在Android平台上,实现消息推送涉及到服务端的消息发送、客户端的消息接收、通知渠道(... 目录一、项目概述二、相关知识介绍2.1 消息推送的基本原理2.2 Firebase Cloud Me

C语言函数递归实际应用举例详解

《C语言函数递归实际应用举例详解》程序调用自身的编程技巧称为递归,递归做为一种算法在程序设计语言中广泛应用,:本文主要介绍C语言函数递归实际应用举例的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录前言一、递归的概念与思想二、递归的限制条件 三、递归的实际应用举例(一)求 n 的阶乘(二)顺序打印

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4