三个臭皮匠——集成学习AdaBoost简单代码实现示例

本文主要是介绍三个臭皮匠——集成学习AdaBoost简单代码实现示例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

转载自[https://zhuanlan.zhihu.com/p/27126737]

三个臭皮匠——AdaBoost简单代码实现示例

    • 转载内容(引子)
    • 第一个学习器
      • 封装函数(python)
      • 第一轮误差
    • 第二个学习器
      • 第二轮误差
    • 第三个学习器
      • 第三轮误差
    • 总结

转载内容(引子)

集成学习概念
例题

第一个学习器

返回顶部

import numpy as np
import pandas as pddata = {'x':[i for i in range(10)], 'y':[1, 1, 1, -1, -1, -1, 1, 1, 1, -1]}
df = pd.DataFrame(data, columns=['x', 'y'])
df['w'] = 0.1
df
xyw
0010.1
1110.1
2210.1
33-10.1
44-10.1
55-10.1
6610.1
7710.1
8810.1
99-10.1

封装函数(python)

返回顶部
正函数(小于分界点为1,大于分界点为-1,reverse = True)
负函数(小于分界点为-1,大于分界点为1,reverse = False)

def find_min(df, reverse=True):# 正函数g_p = lambda x,s:int(x < s) * 2 - 1  # 满足时1 * 2 - 1 = 1;不满足时0 * 2 - 1 = -1# 负函数g_n = lambda x,s:int(x > s) * 2 - 1g = g_p if reverse else g_nx = df['x']e_idx = 1  # 误差权重初值x_idx = 0  # 误差权重初值对应分界点   for i in x:df_temp = df.copy(deep=True)df_temp['e'] = 0     # 将['e']属性先统一赋值0df_temp['G'] = df_temp['x'].apply(lambda x: g(x, i - 0.5))df_temp.loc[df_temp['y'] != df_temp['G'], ['e']] = df_temp['w']  # 当['y']属性与['G']属性不一致时,['e']为其权重e = df_temp['e'].sum()  # 误差(['y']与['G']不一致)权重求和if e < e_idx:           # 找最小误差权重及其对应分界点e_idx, x_idx = e, (i - 0.5)return g, round(e_idx, 3), round(x_idx, 1)
def find_func(df):g_p, e_p, s_p = find_min(df)  # 正函数返回误差及对应分界点g_n, e_n, s_n = find_min(df, reverse = False)  # 负函数返回误差及对应分界点if e_p < e_n:  # 选择误差较小的正函数(或负函数)return g_p, e_p, s_preturn g_n, e_n, s_n
def alpha(df):g, e, split = find_func(df)alpha = round((1.0 / 2) * (np.log(1 - e) - np.log(e)), 4)df['G'] = df['x'].apply(lambda x: g(x, split))df['w'] = round(df['w']* np.exp(-alpha * df['y'] * df['G']), 4)df['w'] = round(df['w'] / (df['w'].sum()), 4)return g, split, alpha

第一个学习器

g1, split1, alpha1 = alpha(df)
alpha1
0.4236
func =lambda x:np.sign(alpha1 * g1(x, split1))
df['G'] = df['x'].apply(lambda x: int(func(x)))
df
xywG
0010.07151
1110.07151
2210.07151
33-10.0715-1
44-10.0715-1
55-10.0715-1
6610.1666-1
7710.1666-1
8810.1666-1
99-10.0715-1

第一轮误差

返回顶部
第一轮误差

df.loc[df['y'] != df['G'], ['x']].count()
x    3
dtype: int64

第二个学习器

返回顶部
第二个学习器

g2, split2, alpha2 = alpha(df)
alpha2
0.6505
func =lambda x:np.sign(alpha1 * g1(x, split1) + alpha2 * g2(x, split2))
df['G'] = df['x'].apply(lambda x: int(func(x)))
df
xywG
0010.04541
1110.04541
2210.04541
33-10.16691
44-10.16691
55-10.16691
6610.10591
7710.10591
8810.10591
99-10.0454-1

第二轮误差

返回顶部
第二轮误差

df.loc[df['y'] != df['G'], ['x']].count()
x    3
dtype: int64

第三个学习器

返回顶部
第三个学习器

g3, split3, alpha3 = alpha(df)
alpha3
0.7514
func =lambda x:np.sign(alpha1 * g1(x, split1) + alpha2 * g2(x, split2) + alpha3 * g3(x, split3))
df['G'] = df['x'].apply(lambda x: int(func(x)))
df
xywG
0010.12481
1110.12481
2210.12481
33-10.1021-1
44-10.1021-1
55-10.1021-1
6610.06491
7710.06491
8810.06491
99-10.1248-1

第三轮误差

返回顶部
第三轮误差

df.loc[df['y'] != df['G'], ['x']].count()
x    0
dtype: int64

总结

“三个臭皮匠抵过一个诸葛亮”,多个弱分类器(准确率大于50%)串起来(协作)能达到很好的准确度。

欢迎关注,敬请点赞!
返回顶部

这篇关于三个臭皮匠——集成学习AdaBoost简单代码实现示例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/701438

相关文章

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

Java枚举类实现Key-Value映射的多种实现方式

《Java枚举类实现Key-Value映射的多种实现方式》在Java开发中,枚举(Enum)是一种特殊的类,本文将详细介绍Java枚举类实现key-value映射的多种方式,有需要的小伙伴可以根据需要... 目录前言一、基础实现方式1.1 为枚举添加属性和构造方法二、http://www.cppcns.co

使用Python实现快速搭建本地HTTP服务器

《使用Python实现快速搭建本地HTTP服务器》:本文主要介绍如何使用Python快速搭建本地HTTP服务器,轻松实现一键HTTP文件共享,同时结合二维码技术,让访问更简单,感兴趣的小伙伴可以了... 目录1. 概述2. 快速搭建 HTTP 文件共享服务2.1 核心思路2.2 代码实现2.3 代码解读3.

使用C#代码在PDF文档中添加、删除和替换图片

《使用C#代码在PDF文档中添加、删除和替换图片》在当今数字化文档处理场景中,动态操作PDF文档中的图像已成为企业级应用开发的核心需求之一,本文将介绍如何在.NET平台使用C#代码在PDF文档中添加、... 目录引言用C#添加图片到PDF文档用C#删除PDF文档中的图片用C#替换PDF文档中的图片引言在当

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面

MySQL双主搭建+keepalived高可用的实现

《MySQL双主搭建+keepalived高可用的实现》本文主要介绍了MySQL双主搭建+keepalived高可用的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、测试环境准备二、主从搭建1.创建复制用户2.创建复制关系3.开启复制,确认复制是否成功4.同

Java实现文件图片的预览和下载功能

《Java实现文件图片的预览和下载功能》这篇文章主要为大家详细介绍了如何使用Java实现文件图片的预览和下载功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... Java实现文件(图片)的预览和下载 @ApiOperation("访问文件") @GetMapping("

用js控制视频播放进度基本示例代码

《用js控制视频播放进度基本示例代码》写前端的时候,很多的时候是需要支持要网页视频播放的功能,下面这篇文章主要给大家介绍了关于用js控制视频播放进度的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言html部分:JavaScript部分:注意:总结前言在javascript中控制视频播放

使用Sentinel自定义返回和实现区分来源方式

《使用Sentinel自定义返回和实现区分来源方式》:本文主要介绍使用Sentinel自定义返回和实现区分来源方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Sentinel自定义返回和实现区分来源1. 自定义错误返回2. 实现区分来源总结Sentinel自定

Mysql表的简单操作(基本技能)

《Mysql表的简单操作(基本技能)》在数据库中,表的操作主要包括表的创建、查看、修改、删除等,了解如何操作这些表是数据库管理和开发的基本技能,本文给大家介绍Mysql表的简单操作,感兴趣的朋友一起看... 目录3.1 创建表 3.2 查看表结构3.3 修改表3.4 实践案例:修改表在数据库中,表的操作主要