本文主要是介绍跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
首先导入pandas、numpy以及常用库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as snsCalendar = pd.read_csv("calendar.csv")
Calendar.head()
# 查看数据集的形状
print(Calendar.shape)
# 查看列名
print(Calendar.columns)
# 查看每列的数据类型
print(Calendar.dtypes)
# 查看数据集的摘要统计信息
print(Calendar.describe())
了解了数据集的基本信息之后,对数据集进行初步的整理。首先是将“$”替换为“”。
然后将日期整理为标准格式。
# 去除重复行
Calendar = Calendar.drop_duplicates()Calendar['price'] = Calendar['price'].str.replace('$', '')
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace('$', '')
Calendar = Calendar.drop(['listing_id', 'available'], axis=1)
Calendar['date'] = pd.to_datetime(Calendar['date'])
做完这些准备工作之后,开始进行基本的数据分析。但这时候发现,报错了符号不正确。
于是增加一步去除“,”。
Calendar['price'] = Calendar['price'].str.replace(',', '').astype(float)
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace(',', '').astype(float)
Calendar.head()
通过average_price = Calendar['price'].mean()
可以查看伦敦的平均房租为
195.5802719724881
average_price = Calendar['price'].mean()
print(average_price)
接下来尝试查看一年中,价格随着月份的变化趋势:
首先整理日期:
Calendar['date'] = pd.to_datetime(Calendar['date'])
Calendar.set_index('date', inplace=True)
Calendar.sort_index(inplace=True)
然后作图:
import matplotlib.pyplot as pltplt.figure(figsize=(10, 6))
plt.plot(monthly_prices.index, monthly_prices.values)
plt.xlabel('Date')
plt.ylabel('Average Price')
plt.title('Monthly Average Price Trend')
plt.xticks(rotation=45)
plt.show()
可以看到,每年的暑假期间(7、8月份)以及圣诞期间(12、1)月的价格最高。
暑假的变化较为平缓,而圣诞期间的价格为突然升高 。
##本文到此结束,后面的部分下次再完善。
本欲继续分析一年中,周一到周五的价格变化情况,用了如下代码,但是并未得到满意结果:
import matplotlib.pyplot as plt# 创建子图
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(10, 8))# 绘制价格变化子图
ax1.plot(daily_prices.index, daily_prices.values)
ax1.set_xlabel('Day of Week')
ax1.set_ylabel('Average Price')
ax1.set_title('Daily Average Price')
Text(0.5, 1.0, 'Daily Average Price')
# 绘制入住人数变化子图
ax2.plot(daily_guests.index, daily_guests.values)
ax2.set_xlabel('Day of Week')
ax2.set_ylabel('Average Minimum Nights')
ax2.set_title('Daily Average Minimum Nights')
Text(0.5, 1.0, 'Daily Average Minimum Nights')
# 设置x轴刻度标签
weekday_labels = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
ax1.set_xticks(range(7))
ax1.set_xticklabels(weekday_labels, rotation=45)
ax2.set_xticks(range(7))
ax2.set_xticklabels(weekday_labels, rotation=45)
[Text(0, 0, 'Monday'),Text(1, 0, 'Tuesday'),Text(2, 0, 'Wednesday'),Text(3, 0, 'Thursday'),Text(4, 0, 'Friday'),Text(5, 0, 'Saturday'),Text(6, 0, 'Sunday')]
# 调整子图之间的间距
plt.tight_layout()# 显示图形
print(plt.show())
<Figure size 640x480 with 0 Axes>
None
结果并不令人满意。所以本次数据分析仅得到房租价格随月份变化的趋势。
这篇关于跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!