机器学习小tip

2024-05-05 11:28

文章标签 学习机器 tip

本文主要是介绍机器学习小tip，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

有监督学习是通过现有训练数据集进行建模，再用模型对新的数据样本进行分类或者回归分析的机器学习方法。

而无监督学习，或者说非监督式学习，则是在没有训练数据集的情况下，对没有标签的数据进行分析并建立合适的模型，以便给出问题解决方案的方法。在无监督学习当中，常见的两种任务类型是数据转换和聚类分析。

对于分类来说，机器学习的目标是对样本的类标签进行预测，判断样本属于哪一个分类，结果是离散的数值。

给定样本，划分样本。

而对于回归分析来说，其目标是要预测一个连续的数值或者是范围。

给定样本，给出标准，返还匹配程度。

在有监督学习中，我们会在训练数据集上建立一个模型，之后会把这个模型用于新的，之前从未见过的数据中，这个过程称为模型的泛化。

泛化的时候使用测试数据集对模型的表现进行评估。

训练数据集合拟合性好，测试数据集合拟合性差。

如果你在训练数据集上使用了一个非常复杂的模型，以至于这个模型在拟合训练数据集时表现非常好，但是在测试数据集的表现非常差，说明模型出现了过拟合的问题。

训练数据集合和测试数据集合拟合性都差

如果模型过于简单，连训练数据集的特点都不能完全考虑到的话，那么这样的模型在训练数据集和测试数据集的得分都会非常差，这个时候我们说模型出现了欠拟合的问题。

这篇关于机器学习小tip的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！