跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析

本文主要是介绍跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 首先导入pandas、numpy以及常用库

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as snsCalendar = pd.read_csv("calendar.csv")
Calendar.head()

# 查看数据集的形状
print(Calendar.shape)

# 查看列名
print(Calendar.columns)

# 查看每列的数据类型
print(Calendar.dtypes)

# 查看数据集的摘要统计信息
print(Calendar.describe())

 了解了数据集的基本信息之后,对数据集进行初步的整理。首先是将“$”替换为“”。

然后将日期整理为标准格式。

# 去除重复行
Calendar = Calendar.drop_duplicates()Calendar['price'] = Calendar['price'].str.replace('$', '')
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace('$', '')
Calendar = Calendar.drop(['listing_id', 'available'], axis=1)
Calendar['date'] = pd.to_datetime(Calendar['date'])

 做完这些准备工作之后,开始进行基本的数据分析。但这时候发现,报错了符号不正确。

于是增加一步去除“,”。

 

Calendar['price'] = Calendar['price'].str.replace(',', '').astype(float)
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace(',', '').astype(float)
Calendar.head()

 通过average_price = Calendar['price'].mean()
可以查看伦敦的平均房租为

195.5802719724881
average_price = Calendar['price'].mean()
print(average_price)

接下来尝试查看一年中,价格随着月份的变化趋势:

首先整理日期:

Calendar['date'] = pd.to_datetime(Calendar['date'])
Calendar.set_index('date', inplace=True)
Calendar.sort_index(inplace=True)

然后作图:

import matplotlib.pyplot as pltplt.figure(figsize=(10, 6))
plt.plot(monthly_prices.index, monthly_prices.values)
plt.xlabel('Date')
plt.ylabel('Average Price')
plt.title('Monthly Average Price Trend')
plt.xticks(rotation=45)
plt.show()

 

可以看到,每年的暑假期间(7、8月份)以及圣诞期间(12、1)月的价格最高。

暑假的变化较为平缓,而圣诞期间的价格为突然升高 。

##本文到此结束,后面的部分下次再完善。

本欲继续分析一年中,周一到周五的价格变化情况,用了如下代码,但是并未得到满意结果:

import matplotlib.pyplot as plt# 创建子图
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(10, 8))# 绘制价格变化子图
ax1.plot(daily_prices.index, daily_prices.values)
ax1.set_xlabel('Day of Week')
ax1.set_ylabel('Average Price')
ax1.set_title('Daily Average Price')
Text(0.5, 1.0, 'Daily Average Price')

# 绘制入住人数变化子图
ax2.plot(daily_guests.index, daily_guests.values)
ax2.set_xlabel('Day of Week')
ax2.set_ylabel('Average Minimum Nights')
ax2.set_title('Daily Average Minimum Nights')
Text(0.5, 1.0, 'Daily Average Minimum Nights')
# 设置x轴刻度标签
weekday_labels = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
ax1.set_xticks(range(7))
ax1.set_xticklabels(weekday_labels, rotation=45)
ax2.set_xticks(range(7))
ax2.set_xticklabels(weekday_labels, rotation=45)
[Text(0, 0, 'Monday'),Text(1, 0, 'Tuesday'),Text(2, 0, 'Wednesday'),Text(3, 0, 'Thursday'),Text(4, 0, 'Friday'),Text(5, 0, 'Saturday'),Text(6, 0, 'Sunday')]
# 调整子图之间的间距
plt.tight_layout()# 显示图形
print(plt.show())
<Figure size 640x480 with 0 Axes>
None

结果并不令人满意。所以本次数据分析仅得到房租价格随月份变化的趋势。

这篇关于跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/255520

相关文章

使用Jackson进行JSON生成与解析的新手指南

《使用Jackson进行JSON生成与解析的新手指南》这篇文章主要为大家详细介绍了如何使用Jackson进行JSON生成与解析处理,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 核心依赖2. 基础用法2.1 对象转 jsON(序列化)2.2 JSON 转对象(反序列化)3.

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

Java进行文件格式校验的方案详解

《Java进行文件格式校验的方案详解》这篇文章主要为大家详细介绍了Java中进行文件格式校验的相关方案,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、背景异常现象原因排查用户的无心之过二、解决方案Magandroidic Number判断主流检测库对比Tika的使用区分zip

Java使用Curator进行ZooKeeper操作的详细教程

《Java使用Curator进行ZooKeeper操作的详细教程》ApacheCurator是一个基于ZooKeeper的Java客户端库,它极大地简化了使用ZooKeeper的开发工作,在分布式系统... 目录1、简述2、核心功能2.1 CuratorFramework2.2 Recipes3、示例实践3

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Python使用date模块进行日期处理的终极指南

《Python使用date模块进行日期处理的终极指南》在处理与时间相关的数据时,Python的date模块是开发者最趁手的工具之一,本文将用通俗的语言,结合真实案例,带您掌握date模块的六大核心功能... 目录引言一、date模块的核心功能1.1 日期表示1.2 日期计算1.3 日期比较二、六大常用方法详

Python使用DrissionPage中ChromiumPage进行自动化网页操作

《Python使用DrissionPage中ChromiumPage进行自动化网页操作》DrissionPage作为一款轻量级且功能强大的浏览器自动化库,为开发者提供了丰富的功能支持,本文将使用Dri... 目录前言一、ChromiumPage基础操作1.初始化Drission 和 ChromiumPage

Spring AI ectorStore的使用流程

《SpringAIectorStore的使用流程》SpringAI中的VectorStore是一种用于存储和检索高维向量数据的数据库或存储解决方案,它在AI应用中发挥着至关重要的作用,本文给大家介... 目录一、VectorStore的基本概念二、VectorStore的核心接口三、VectorStore的

Jackson库进行JSON 序列化时遇到了无限递归(Infinite Recursion)的问题及解决方案

《Jackson库进行JSON序列化时遇到了无限递归(InfiniteRecursion)的问题及解决方案》使用Jackson库进行JSON序列化时遇到了无限递归(InfiniteRecursi... 目录解决方案‌1. 使用 @jsonIgnore 忽略一个方向的引用2. 使用 @JsonManagedR