Python学习 Day49 Python与MySQL的交互操作 15

2023-11-30 00:18

本文主要是介绍Python学习 Day49 Python与MySQL的交互操作 15,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Python与MySQL的交互操作

案例——链家二手房数据

请求数据获取
在这里插入图片描述
数据解析
在这里插入图片描述
房名
在这里插入图片描述
房型信息
在这里插入图片描述

位置信息
在这里插入图片描述
房屋售价
在这里插入图片描述
每平单价
在这里插入图片描述
关注人数/发布时间
在这里插入图片描述
标签信息
在这里插入图片描述


MySQL中创建数据表
在这里插入图片描述

pycharm中创建SQL文件
在这里插入图片描述


具体实现代码

import requests
from bs4 import BeautifulSoup
import pymysqlclass LianJiaSpider():# 打开数据库连接db = pymysql.connect(host='localhost', port=3306, user='root', password='123456', db='test', charset='utf8')# 使用cursor()方法获取操作游标cursor = db.cursor()def __init__(self):self.url = 'http://bj.lianjia.com/ershoufang/pg{0}/' #{0}表示字符串的格式化self.heasers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'}def send_requests(self,url):'''发送请求'''resp = requests.get(url,headers=self.heasers)if resp.status_code == 200:  #判断响应状态码,200时正常返回数据return respdef parse_html(self,resp):'''解析数据'''lst = [] #用于存放数据html = resp.textbs = BeautifulSoup(html,'lxml')ul = bs.find('ul',class_='sellListContent')li_list = ul.find_all('li')#print(len(li_list))  #检查是否获取到数据for item in li_list:title = item.find('div',class_='title').text #循环获得标题的文本内容houseInfo = item.find('div',class_='houseInfo').text #获取每套房子的房型信息positionInfo = item.find('div',class_='positionInfo').text #获取每套房子的位置信息totalPrice = item.find('div',class_='totalPrice').text #获取每套房子的销售总价unitPrice = item.find('div',class_='unitPrice').text #获取每套房的单价followInfo = item.find('div',class_='followInfo') #获得每套房的关注信息if followInfo != None:           #去除空值数据followInfo = followInfo.textelse:followInfo = ''#print(title) #输出房名#print(houseInfo) #输出房型信息#print(positionInfo)  # 输出位置信息#print(totalPrice) #输出销售总价#print(unitPrice) #输出房屋单价信息#print(followInfo) #输出每套房的关注信息lst.append((title,houseInfo,positionInfo,totalPrice,unitPrice,followInfo))#print(lst)self.save(lst) #调用save函数存储数据def save(self,lst):'''存储数据'''#print(self.db) #连接成功提示:<pymysql.connections.Connection object at 0x00000249256C4E48>sql = 'insert into tb_lianjia (title,houseInfo,positionInfo,totalPrice,unitPrice,followInfo) values (%s,%s,%s,%s,%s,%s)'self.cursor.executemany(sql,lst)self.db.commit()print(self.cursor.rowcount,'插入成功')def start(self):'''启动爬虫程序'''for i in range(1,2): #当前只爬取一页数据,若为多页修改range函数范围即可full_url = self.url.format(i) #完整URL的拼接resp = self.send_requests(full_url) #拼接后发送请求#print(resp.text)self.parse_html(resp)if __name__ == '__main__':lianjia = LianJiaSpider()lianjia.start()

结果
在这里插入图片描述

这篇关于Python学习 Day49 Python与MySQL的交互操作 15的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/434880

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置