跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析

本文主要是介绍跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 首先导入pandas、numpy以及常用库

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as snsCalendar = pd.read_csv("calendar.csv")
Calendar.head()

# 查看数据集的形状
print(Calendar.shape)

# 查看列名
print(Calendar.columns)

# 查看每列的数据类型
print(Calendar.dtypes)

# 查看数据集的摘要统计信息
print(Calendar.describe())

 了解了数据集的基本信息之后,对数据集进行初步的整理。首先是将“$”替换为“”。

然后将日期整理为标准格式。

# 去除重复行
Calendar = Calendar.drop_duplicates()Calendar['price'] = Calendar['price'].str.replace('$', '')
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace('$', '')
Calendar = Calendar.drop(['listing_id', 'available'], axis=1)
Calendar['date'] = pd.to_datetime(Calendar['date'])

 做完这些准备工作之后,开始进行基本的数据分析。但这时候发现,报错了符号不正确。

于是增加一步去除“,”。

 

Calendar['price'] = Calendar['price'].str.replace(',', '').astype(float)
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace(',', '').astype(float)
Calendar.head()

 通过average_price = Calendar['price'].mean()
可以查看伦敦的平均房租为

195.5802719724881
average_price = Calendar['price'].mean()
print(average_price)

接下来尝试查看一年中,价格随着月份的变化趋势:

首先整理日期:

Calendar['date'] = pd.to_datetime(Calendar['date'])
Calendar.set_index('date', inplace=True)
Calendar.sort_index(inplace=True)

然后作图:

import matplotlib.pyplot as pltplt.figure(figsize=(10, 6))
plt.plot(monthly_prices.index, monthly_prices.values)
plt.xlabel('Date')
plt.ylabel('Average Price')
plt.title('Monthly Average Price Trend')
plt.xticks(rotation=45)
plt.show()

 

可以看到,每年的暑假期间(7、8月份)以及圣诞期间(12、1)月的价格最高。

暑假的变化较为平缓,而圣诞期间的价格为突然升高 。

##本文到此结束,后面的部分下次再完善。

本欲继续分析一年中,周一到周五的价格变化情况,用了如下代码,但是并未得到满意结果:

import matplotlib.pyplot as plt# 创建子图
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(10, 8))# 绘制价格变化子图
ax1.plot(daily_prices.index, daily_prices.values)
ax1.set_xlabel('Day of Week')
ax1.set_ylabel('Average Price')
ax1.set_title('Daily Average Price')
Text(0.5, 1.0, 'Daily Average Price')

# 绘制入住人数变化子图
ax2.plot(daily_guests.index, daily_guests.values)
ax2.set_xlabel('Day of Week')
ax2.set_ylabel('Average Minimum Nights')
ax2.set_title('Daily Average Minimum Nights')
Text(0.5, 1.0, 'Daily Average Minimum Nights')
# 设置x轴刻度标签
weekday_labels = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
ax1.set_xticks(range(7))
ax1.set_xticklabels(weekday_labels, rotation=45)
ax2.set_xticks(range(7))
ax2.set_xticklabels(weekday_labels, rotation=45)
[Text(0, 0, 'Monday'),Text(1, 0, 'Tuesday'),Text(2, 0, 'Wednesday'),Text(3, 0, 'Thursday'),Text(4, 0, 'Friday'),Text(5, 0, 'Saturday'),Text(6, 0, 'Sunday')]
# 调整子图之间的间距
plt.tight_layout()# 显示图形
print(plt.show())
<Figure size 640x480 with 0 Axes>
None

结果并不令人满意。所以本次数据分析仅得到房租价格随月份变化的趋势。

这篇关于跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/255520

相关文章

微服务架构之使用RabbitMQ进行异步处理方式

《微服务架构之使用RabbitMQ进行异步处理方式》本文介绍了RabbitMQ的基本概念、异步调用处理逻辑、RabbitMQ的基本使用方法以及在SpringBoot项目中使用RabbitMQ解决高并发... 目录一.什么是RabbitMQ?二.异步调用处理逻辑:三.RabbitMQ的基本使用1.安装2.架构

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

Linux使用fdisk进行磁盘的相关操作

《Linux使用fdisk进行磁盘的相关操作》fdisk命令是Linux中用于管理磁盘分区的强大文本实用程序,这篇文章主要为大家详细介绍了如何使用fdisk进行磁盘的相关操作,需要的可以了解下... 目录简介基本语法示例用法列出所有分区查看指定磁盘的区分管理指定的磁盘进入交互式模式创建一个新的分区删除一个存

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

使用Python进行文件读写操作的基本方法

《使用Python进行文件读写操作的基本方法》今天的内容来介绍Python中进行文件读写操作的方法,这在学习Python时是必不可少的技术点,希望可以帮助到正在学习python的小伙伴,以下是Pyth... 目录一、文件读取:二、文件写入:三、文件追加:四、文件读写的二进制模式:五、使用 json 模块读写

使用zabbix进行监控网络设备流量

《使用zabbix进行监控网络设备流量》这篇文章主要为大家详细介绍了如何使用zabbix进行监控网络设备流量,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录安装zabbix配置ENSP环境配置zabbix实行监控交换机测试一台liunx服务器,这里使用的为Ubuntu22.04(

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

在Pandas中进行数据重命名的方法示例

《在Pandas中进行数据重命名的方法示例》Pandas作为Python中最流行的数据处理库,提供了强大的数据操作功能,其中数据重命名是常见且基础的操作之一,本文将通过简洁明了的讲解和丰富的代码示例,... 目录一、引言二、Pandas rename方法简介三、列名重命名3.1 使用字典进行列名重命名3.编

python安装完成后可以进行的后续步骤和注意事项小结

《python安装完成后可以进行的后续步骤和注意事项小结》本文详细介绍了安装Python3后的后续步骤,包括验证安装、配置环境、安装包、创建和运行脚本,以及使用虚拟环境,还强调了注意事项,如系统更新、... 目录验证安装配置环境(可选)安装python包创建和运行Python脚本虚拟环境(可选)注意事项安装