本文主要是介绍001-基于Sklearn的机器学习入门:Sklearn库基本功能和标准数据集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
本节将介绍Sklearn库基本功能,以及其自带的几个标准数据集的调用方法。本节是学习后面内容的基础,如果您已经对本节内容相当熟悉,可跳过本节内容。
1.1 Sklearn库基本功能
的
1.2 Sklearn库标准数据集
Sklearn自带许多标准数据集,这些数据集从简单到复杂,可用于机器学习的各个领域。主要包括以下四类:
- Toy datasets
- Real world datasets
- Generated datasets 生成式数据集
- Loading other datasets 其它来源数据集
(1)波士顿房价数据集
波士顿房价数据集(Boston Housing Dataset)
该数据集包含了 506 个波士顿地区的房屋数据,其中每个数据点都有 13 个变量(例如犯罪率、房产税率、房间数量等)和一个目标变量(房屋价格的中位数)。该数据集最初由 Harrison, D. 和 Rubinfeld, D.L. 在 1978 年发布。
https://zhuanlan.zhihu.com/p/618818240
这篇关于001-基于Sklearn的机器学习入门:Sklearn库基本功能和标准数据集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!