本文主要是介绍学生成绩预测模型_越看头发越多—数据挖掘之分类与预测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据挖掘中最典型的四种方法是:
分类与预测、聚类分析、关联规则、时序模式,我试试能不能用大白话讲清楚 概念、常用算法、分类、原理及评价标准。
第一部分是分类与预测
一、概念
分类与预测指的都是根据一些特征来预测问题,是机器学习中最常见的的监督学习算法。即从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。
要点一:分类和预测的区别在于,分类对应的是离散型结果,预测通常对应连续型结果。
要点二:监督学习的训练集要求包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。即,学习函数时要给出特征和目标。
举个简单的例子
小明的妈妈想预测小明高考时考的怎么样:
如果小明妈妈想预测的是小明的分数,分数是数值型变量,这属于预测;如果小明妈妈想预测的是小明能考入名校/非名校,是否考入名校是离散型变量,这属于分类。
无论是要预测分数还是是否考入名校,小明的妈妈都需要先给一堆已知考的怎么样的历史样本,这些样本的属性是跟考试相关的指标:学生智商,平时成绩,学校排名,学习时长,是否容易紧张等。把这些样本交给机器,让机器学习出一个函数,去预测小明考的怎么样。
这篇关于学生成绩预测模型_越看头发越多—数据挖掘之分类与预测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!