本文主要是介绍波士顿房价问题可视化:散点图感受价格相关因素数据分布,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
波士顿房价问题也是机器学习中的一个入门问题,sklearn这个模块中包含了500多条波士顿房价的数据,其中包括13个相关的因素。类似于鸢尾花数据可视化的处理(参考博文鸢尾花数据进行可视化展示)的处理方式,我们先把datasets的数据转换成我们熟悉的DF数据,这一次,我们是用python自带的matplot库中的方法来绘制散点图。具体的代码如下所示,其中用到了一些python的技巧,总结如下:
1.双重for循环列表生成式生成二维的数据列表;
2.zip方法打包两个列表并且转换成字典类型;
3.pandas的DataFrame的数据创建与读取;
4.matplotlib的绘图方法。
from sklearn import datasets
import pandas as pd
import matplotlib.pyplot as plt
import math
boston = datasets.load_boston()
factor_list = list(boston.feature_names)
facvals = [ [boston.data[i][index] for i in range(len(boston.data))] for index in range(len(factor_list)) ]
factor_list.append('TARGET')
facvals.append(boston.target)
factor_dict = dict(zip(factor_list,facvals))
boston_df = pd.DataFrame(factor_dict, # columns = ['CRIM','CHAS','AGE','TARGET'],)
def plot(strfac):x_axis = list(boston_df[strfac])y_axis = list(boston_df['TARGET'])plt.title(strfac)plt.ylabel('Price')plt.scatter(x_axis,y_axis,s=3)for i in range(len(factor_list)):index = i+1factor = factor_list[i]plt.subplot(3,5,index)plot(factor)plt.show()
我们最终生成了以下图形:
这篇关于波士顿房价问题可视化:散点图感受价格相关因素数据分布的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!