本文主要是介绍Scikit-learn学习笔记(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Scikit-learn学习笔记(一)
这段时间在学习机器学习相关的知识,一方面要学习理论知识,另一方面还要不断的练习和实践,只有不断的实践才能真正地掌握和理解这些理论知识。在众多编程语言中,python具有独特的优势,也是机器学习领域使用最多的语言之一,因为其语法简洁、可移植性好以及快速迭代的优势,使其成为机器学习各种算法实现的最佳载体之一,scikit-learn是python版的机器学习库,其内部实现了众多常用的机器学习算法,受到许多机器学习爱好者的青睐。
1. scikit-learn简介
自2007年发布以来,scikit-learn已经成为最给力的Python机器学习库(library)了。scikit-learn支持的机器学习算法包括分类,回归,降维和聚类。还有一些特征提取(extracting features)、数据处理(processing data)和模型评估(evaluating models)的模块。作为Scipy库的扩展,scikit-learn也是建立在Python的NumPy和matplotlib库基础之上。NumPy可以让Python支持大量多维矩阵数据的高效操作,matplotlib提供了可视化工具,SciPy带有许多科学计算的模型。
scikit-learn文档完善,容易上手,丰富的API,使其在学术界颇受欢迎。开发者用scikit-learn实验不同的算法,只要几行代码就可以搞定。scikit-learn包括许多知名的机器学习算法的实现,包括LIBSVM和LIBLINEAR。还封装了其他的Python库,如自然语言处理的NLTK库。另外,scikit-learn内置了大量数据集,允许开发者集中于算法设计,节省获取和整理数据集的时间。
scikit-learn可以不受任何限制,遵从自由的BSD授权。许多scikit-learn的算法都可以快速执行而且可扩展,除了海量数据集以外。最后,scikit-learn稳定性很好,大部分代码都可以通过Python的自动化测试(mock,nose等)。
2. 安装scikit-learn
目前scikit-learn的稳定版本是0.17.1。用这个版本可以保证本书的代码可以正常运行,如果你之前装过,可以检查一下版本:
In [3]:
import sklearn
sklearn.__version__
Out[3]:
'0.17.1'
如果你还没安装,你可以通过pip安装,也可以从源代码安装。下面我们简单介绍一下Windows,Linux和Mac OS系统分别安装的过程,具体内容可以从官方网站 (http://scikitlearn.org/dev/install.html)找到。Python版本需要是Python (>= 2.6 or >= 3.3),NumPy (>= 1.6.1),SciPy (>= 0.9)。
2.1 Windows系统安装
强烈建议使用miniconda (http://conda.pydata.org/miniconda.html)安装,可以根据Windows系统版
本和想要的Python版本选择下载安装。
miniconda会自动安装scikit-learn的依赖包,如NumPy和SciPy等。双击安装文件安装miniconda,之后在命令行工具输入下列指令:
conda install scikit-learn
确实之后一会儿就安装完了,如果要更新版本,直接输入:
conda update scikit-learn
如果已经装好了Python,Numpy和Scipy,可以用pip安装(Python 2.7.9和Python3.4自带):
pip install -U scikit-learn
这篇关于Scikit-learn学习笔记(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!