本文主要是介绍【20200415】数据挖掘DM课程课业打卡六之决策树归纳模型的过分拟合,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
【20200415】数据挖掘DM课程课业打卡六之决策树归纳&模型的过分拟合
- 一、课业打卡六
- 二、知识点巩固
- 1、三个决策树算法
- 2、三种著名的决策树
- 3、表示属性测试条件的方法
- 4、基于连续属性的划分 (ID3 算法 )
- 5、选择最佳划分的度量
- 6、不纯性的测量: GINI
- 7、不纯性的测量: Classification Error
- 8、不纯性的测量: Entropy(熵)
- 9、模型过分拟合和拟合不足
- 10、导致过分拟合的原因
- 11、处理决策树中的过分拟合
叮嘟!这里是小啊呜的学习课程资料整理。好记性不如烂笔头,今天也是努力进步的一天。一起加油进阶吧!

一、课业打卡六
一、填空题
1、已知一个数据集,其中有2个类的样本,这2个类的样本数量分别为1、2,则该数据集的熵值为____。
(说明:熵写成-(b/a)*log2(b/a)-(d/c)*log2(d/c)的形式。其中,分数b/a、d/c约分为最简形式)
正确答案:答案形式不唯一–(1/3)log2(1/3)–(2/3)log2(2/3);
–(2/3)log2(2/3)–(1/3)log2(1/3);
-(1/3)log2(1/3)-(2/3)log2(2/3);
-(2/3)log2
这篇关于【20200415】数据挖掘DM课程课业打卡六之决策树归纳模型的过分拟合的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!