本文主要是介绍机器学习小tip,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
有监督学习
有监督学习是通过现有训练数据集进行建模,再用模型对新的数据样本进行分类或者回归分析的机器学习 方法。
无监督学习
而无监督学习,或者说非监督式学习,则是在没有训练数据集的情况下,对没有标 签的数据进行分析并建立合适的模型,以便给出问题解决方案的方法。在无监督学习当中,常见的两种任务类型是数据转换和聚类分析。
分类
对于分类来说,机器学习的目标是对样本的类标签进行预测,判断样本属于哪一个分类,结果是离散的数值。
给定样本,划分样本。
回归
而对于回归分析来说,其目标是要预测一个连续的数值或者是范围。
给定样本,给出标准,返还匹配程度。
模型的泛化
在有监督学习中,我们会在训练数据集上建立一个模型,之后会把这个模型用于新的,之前从未见过的数据中,这个过程称为模型的泛化。
泛化的时候使用测试数据集对模型的表现进行评估。
模型的过拟合
训练数据集合拟合性好,测试数据集合拟合性差。
如果你在训练数据集上使用了一 个非常复杂的模型,以至于这个模型在拟合训练数据集时表现非常好,但是在测试数据集的表现非常差,说明模型出现了过拟合的问题。
模型的欠拟合
训练数据集合和测试数据集合拟合性都差
如果模型过于简单,连训练数据集的特点都不能完全考虑到的话,那么这样 的模型在训练数据集和测试数据集的得分都会非常差,这个时候我们说模型出现了欠拟合的问题。
这篇关于机器学习小tip的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!