本文主要是介绍[机器学习] sklearn交叉验证(Cross-validation),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
https://blog.csdn.net/guanyuqiu/article/details/86006474
交叉验证(Cross Validation)用来验证分类器的性能一种统计分析方法,
原始数据(dataset)进行分组,一部分用来为训练集(train set),另一部分做为验证集(validation set)。
利用训练集训练分类器,然后利用验证集验证模型,记录最后的分类准确率为此分类器的性能指标。
那么什么时候才需要交叉验证呢?交叉验证用在数据不是很充足的时候。
如果数据样本量小于 一万条,则采用交叉验证来训练优化选择模型。
如果样本大于 一万条,一般随机把样本数据分成三份,一份为训练集,一份为验证集,最后一份为测试集。
用训练集来训练模型,用验证集来评估模型预测的好坏和选择模型及其对应的参数。把最终得到的模型再用于测试集,最终决定使用哪个模型以及对应参数。(训练集训练,验证集调参,测试集测试)
continuing…
这篇关于[机器学习] sklearn交叉验证(Cross-validation)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!