交叉验证,五次五折,十次十折

2023-11-21 07:20

本文主要是介绍交叉验证,五次五折,十次十折,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

交叉验证是一种评估机器学习模型的表现;

其中k折交叉验证就是指:将一个数据集分成k个部分,每次取其中的一份作为测试集,k-1份作为训练集;因此,k折交叉验证就会进行k次,获得k个结果后取平均值

以10折交叉验证为例:

图源周志华《机器学习》

底层实现代码:

for i in range(10):  # 十次data = readdataset("E:\ML\smote\Synthetic_pima_naivesmote.xlsx")lines = data.shape[0]  # 行数test_ratio = 0.1  # 测试集比例t=data.shape[1] label = data[:, t-1]test_line = int(lines * test_ratio)counts = 0for k in range(10):  # 十折for i in range(test_line):classifyresults = classify(data[i], data[test_line:lines], label[test_line:lines], 3)if classifyresults == label[i]:counts += 1aa = copy.deepcopy(data[0:test_line])data[0:lines - test_line] = data[test_line:lines]data[lines - test_line:lines] = aa#print(norm_data)bb = copy.deepcopy(label[0:test_line])label[0:lines - test_line] = label[test_line:lines]label[lines - test_line:lines] = bbprint('knn10次10折交叉验证的正确率为{}'.format(100*counts/lines))

也可以选择sklearn中stratifiedkFold分层采样函数,分层采样可以使得不平衡数据集中各个类别的平衡性,即不会出现测试集中没有少数类的现象

代码如下

from sklearn.model_selection import StratifiedKFold
id = 0
for i in range(5):skf = StratifiedKFold(n_splits=5, shuffle=True,random_state=None)id = 0for train_index,test_index in skf.split(X,y):id+=1X_train, X_test = X[train_index], X[test_index]y_train, y_test = y[train_index], y[test_index]y_train = y_train[:, np.newaxis]y_test = y_test[:,np.newaxis]train = np.hstack((X_train,y_train))test = np.hstack((X_test,y_test))train = pd.DataFrame(train)test = pd.DataFrame(test)train.to_excel('E:\\ML\\smote\\数据集划分\\page-blocks-1-3_vs_4\\'+str(i+1)+'\\train'+str(id)+'.xlsx',index = False)test.to_excel('E:\\ML\\smote\\数据集划分\\page-blocks-1-3_vs_4\\'+str(i+1)+'\\test'+str(id)+'.xlsx',index = False)

这篇关于交叉验证,五次五折,十次十折的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/400748

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目: 题解: class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

easyui同时验证账户格式和ajax是否存在

accountName: {validator: function (value, param) {if (!/^[a-zA-Z][a-zA-Z0-9_]{3,15}$/i.test(value)) {$.fn.validatebox.defaults.rules.accountName.message = '账户名称不合法(字母开头,允许4-16字节,允许字母数字下划线)';return fal

easyui 验证下拉菜单select

validatebox.js中添加以下方法: selectRequired: {validator: function (value) {if (value == "" || value.indexOf('请选择') >= 0 || value.indexOf('全部') >= 0) {return false;}else {return true;}},message: '该下拉框为必选项'}

web群集--nginx配置文件location匹配符的优先级顺序详解及验证

文章目录 前言优先级顺序优先级顺序(详解)1. 精确匹配(Exact Match)2. 正则表达式匹配(Regex Match)3. 前缀匹配(Prefix Match) 匹配规则的综合应用验证优先级 前言 location的作用 在 NGINX 中,location 指令用于定义如何处理特定的请求 URI。由于网站往往需要不同的处理方式来适应各种请求,NGINX 提供了多种匹

React 笔记 父子组件传值 | 父组件调用子组件数据 | defaultProps | propsType合法性验证

1.通过props实现父组件像子组件传值 、方法、甚至整个父组件 传递整个父组件则   [变量名]={this} import Header from "./Header"render(){return(<Header msg={"我是props传递的数据"}/>)} import React,{Component} from "react";class Header extends

Java验证辛钦大数定理

本实验通过程序模拟采集大量的样本数据来验证辛钦大数定理。   实验环境: 本实验采用Java语言编程,开发环境为Eclipse,图像生成使用JFreeChart类。   一,验证辛钦大数定理 由辛钦大数定理描述为: 辛钦大数定理(弱大数定理)  设随机变量序列 X1, X2, … 相互独立,服从同一分布,具有数学期望E(Xi) = μ, i = 1, 2, …, 则对于任意正数ε ,

交叉编译python

1.解决python源码,进入源码目录 2.先编译本地版本的python。直接使用命令 ./configure --prefix=/home/KAS-300/python3.8 --enable-optimizationsmake -j8make install 3.把生成的python可执行文件临时加入PATH export PATH=/home/KAS-300/python3.8/

【python因果推断库11】工具变量回归与使用 pymc 验证工具变量4

目录  Wald 估计与简单控制回归的比较 CausalPy 和 多变量模型 感兴趣的系数 复杂化工具变量公式  Wald 估计与简单控制回归的比较 但现在我们可以将这个估计与仅包含教育作为控制变量的简单回归进行比较。 naive_reg_model, idata_reg = make_reg_model(covariate_df.assign(education=df[