本文主要是介绍[Kaggle]House Prices: Advanced Regression Techniques,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1、背景说明
2、前期准备
3、程序设计
4、知识点说明
5、测试结果
6、总结
7、附录:解释特征
1、背景说明
1.1 项目名称:
House Prices_Advanced Regression Techniques https://www.kaggle.com/c/house-prices-advanced-regression-techniques
1.2 实现目标:
预测出测试集的售价,通过RMSE(均方根误差)来进行评分
1.3 我的成绩:
https://www.kaggle.com/gelhart 275/4076 7%
1.4 所需工具:
python以及相关库(numpy,pandas,skelearn,matplotlib,seaborn)、使用Sublime txt、iPython notebook调试程序
2、前期准备
2.1 安装组件:
python3.6、numpy、pandas、scipy、matplotlib、sklearn、ipython、Sublime txt
2.2 下载数据:
https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data 其中train.csv是训练集,test.csv是测试集,sample submission.csv是提交样例。
2.3 观察分析数据
掌握每个特征的名称、含义、数据类型和数据内容。
3、程序设计
3.1 头文件:
import pandas as pd#数据处理
import matplotlib.pyplot as plt #plot.scatter画散点图
import seaborn as sns#画热力图/箱型图
import numpy as np#数据处理,pandas的基础
from scipy.stats import skew#求偏度
import warnings
warnings.filterwarnings("ignore")#忽略警告
from sklearn.base import BaseEstimator, TransformerMixin, RegressorMixin, clone# sklearn基础函数
from sklearn.preprocessing import LabelEncoder#转换
from sklearn.preprocessing import RobustScaler, StandardScaler#编码
from sklearn.preprocessing import Imputer#处理缺失值
from sklearn.metrics i
这篇关于[Kaggle]House Prices: Advanced Regression Techniques的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!