Python学习 Day49 Python与MySQL的交互操作 15

2023-11-30 00:18

本文主要是介绍Python学习 Day49 Python与MySQL的交互操作 15,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Python与MySQL的交互操作

案例——链家二手房数据

请求数据获取
在这里插入图片描述
数据解析
在这里插入图片描述
房名
在这里插入图片描述
房型信息
在这里插入图片描述

位置信息
在这里插入图片描述
房屋售价
在这里插入图片描述
每平单价
在这里插入图片描述
关注人数/发布时间
在这里插入图片描述
标签信息
在这里插入图片描述


MySQL中创建数据表
在这里插入图片描述

pycharm中创建SQL文件
在这里插入图片描述


具体实现代码

import requests
from bs4 import BeautifulSoup
import pymysqlclass LianJiaSpider():# 打开数据库连接db = pymysql.connect(host='localhost', port=3306, user='root', password='123456', db='test', charset='utf8')# 使用cursor()方法获取操作游标cursor = db.cursor()def __init__(self):self.url = 'http://bj.lianjia.com/ershoufang/pg{0}/' #{0}表示字符串的格式化self.heasers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'}def send_requests(self,url):'''发送请求'''resp = requests.get(url,headers=self.heasers)if resp.status_code == 200:  #判断响应状态码,200时正常返回数据return respdef parse_html(self,resp):'''解析数据'''lst = [] #用于存放数据html = resp.textbs = BeautifulSoup(html,'lxml')ul = bs.find('ul',class_='sellListContent')li_list = ul.find_all('li')#print(len(li_list))  #检查是否获取到数据for item in li_list:title = item.find('div',class_='title').text #循环获得标题的文本内容houseInfo = item.find('div',class_='houseInfo').text #获取每套房子的房型信息positionInfo = item.find('div',class_='positionInfo').text #获取每套房子的位置信息totalPrice = item.find('div',class_='totalPrice').text #获取每套房子的销售总价unitPrice = item.find('div',class_='unitPrice').text #获取每套房的单价followInfo = item.find('div',class_='followInfo') #获得每套房的关注信息if followInfo != None:           #去除空值数据followInfo = followInfo.textelse:followInfo = ''#print(title) #输出房名#print(houseInfo) #输出房型信息#print(positionInfo)  # 输出位置信息#print(totalPrice) #输出销售总价#print(unitPrice) #输出房屋单价信息#print(followInfo) #输出每套房的关注信息lst.append((title,houseInfo,positionInfo,totalPrice,unitPrice,followInfo))#print(lst)self.save(lst) #调用save函数存储数据def save(self,lst):'''存储数据'''#print(self.db) #连接成功提示:<pymysql.connections.Connection object at 0x00000249256C4E48>sql = 'insert into tb_lianjia (title,houseInfo,positionInfo,totalPrice,unitPrice,followInfo) values (%s,%s,%s,%s,%s,%s)'self.cursor.executemany(sql,lst)self.db.commit()print(self.cursor.rowcount,'插入成功')def start(self):'''启动爬虫程序'''for i in range(1,2): #当前只爬取一页数据,若为多页修改range函数范围即可full_url = self.url.format(i) #完整URL的拼接resp = self.send_requests(full_url) #拼接后发送请求#print(resp.text)self.parse_html(resp)if __name__ == '__main__':lianjia = LianJiaSpider()lianjia.start()

结果
在这里插入图片描述

这篇关于Python学习 Day49 Python与MySQL的交互操作 15的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/434880

相关文章

使用Python创建一个能够筛选文件的PDF合并工具

《使用Python创建一个能够筛选文件的PDF合并工具》这篇文章主要为大家详细介绍了如何使用Python创建一个能够筛选文件的PDF合并工具,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录背景主要功能全部代码代码解析1. 初始化 wx.Frame 窗口2. 创建工具栏3. 创建布局和界面控件4

一文详解如何在Python中使用Requests库

《一文详解如何在Python中使用Requests库》:本文主要介绍如何在Python中使用Requests库的相关资料,Requests库是Python中常用的第三方库,用于简化HTTP请求的发... 目录前言1. 安装Requests库2. 发起GET请求3. 发送带有查询参数的GET请求4. 发起PO

Python与DeepSeek的深度融合实战

《Python与DeepSeek的深度融合实战》Python作为最受欢迎的编程语言之一,以其简洁易读的语法、丰富的库和广泛的应用场景,成为了无数开发者的首选,而DeepSeek,作为人工智能领域的新星... 目录一、python与DeepSeek的结合优势二、模型训练1. 数据准备2. 模型架构与参数设置3

Python进行PDF文件拆分的示例详解

《Python进行PDF文件拆分的示例详解》在日常生活中,我们常常会遇到大型的PDF文件,难以发送,将PDF拆分成多个小文件是一个实用的解决方案,下面我们就来看看如何使用Python实现PDF文件拆分... 目录使用工具将PDF按页数拆分将PDF的每一页拆分为单独的文件将PDF按指定页数拆分根据页码范围拆分

Python中常用的四种取整方式分享

《Python中常用的四种取整方式分享》在数据处理和数值计算中,取整操作是非常常见的需求,Python提供了多种取整方式,本文为大家整理了四种常用的方法,希望对大家有所帮助... 目录引言向零取整(Truncate)向下取整(Floor)向上取整(Ceil)四舍五入(Round)四种取整方式的对比综合示例应

python 3.8 的anaconda下载方法

《python3.8的anaconda下载方法》本文详细介绍了如何下载和安装带有Python3.8的Anaconda发行版,包括Anaconda简介、下载步骤、安装指南以及验证安装结果,此外,还介... 目录python3.8 版本的 Anaconda 下载与安装指南一、Anaconda 简介二、下载 An

Python自动化处理手机验证码

《Python自动化处理手机验证码》手机验证码是一种常见的身份验证手段,广泛应用于用户注册、登录、交易确认等场景,下面我们来看看如何使用Python自动化处理手机验证码吧... 目录一、获取手机验证码1.1 通过短信接收验证码1.2 使用第三方短信接收服务1.3 使用ADB读取手机短信1.4 通过API获取

MySQL zip安装包配置教程

《MySQLzip安装包配置教程》这篇文章详细介绍了如何使用zip安装包在Windows11上安装MySQL8.0,包括下载、解压、配置环境变量、初始化数据库、安装服务以及更改密码等步骤,感兴趣的朋... 目录mysql zip安装包配置教程1、下载zip安装包:2、安装2.1 解压zip包到安装目录2.2

python安装whl包并解决依赖关系的实现

《python安装whl包并解决依赖关系的实现》本文主要介绍了python安装whl包并解决依赖关系的实现,文中通过图文示例介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录一、什么是whl文件?二、我们为什么需要使用whl文件来安装python库?三、我们应该去哪儿下

MySQL安装时initializing database失败的问题解决

《MySQL安装时initializingdatabase失败的问题解决》本文主要介绍了MySQL安装时initializingdatabase失败的问题解决,文中通过图文介绍的非常详细,对大家的学... 目录问题页面:解决方法:问题页面:解决方法:1.勾选红框中的选项:2.将下图红框中全部改为英