Aggregation总结：Blending和Bootstrap

本文主要是介绍Aggregation总结：Blending和Bootstrap，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1. Aggregation

首先举一个买房的例子，假如你有10个朋友给出了买房的意见，你如何参考这10个人的意见做出决定呢？

第一种办法是让大家投票，每人一票，最后选择得票数最多的那个选项
第二种办法也是投票，与第一种不同的是每个人手里的票数不一样，懂行的人可能会分配更多的票数
第三种办法是根据具体条件进行判断：这10个人中，有的人可能注重房源的地理位置，有的人可能更注重交通状况。根据不同的条件参考不同人的意见。

Aggregation的目的就是要融合多个hypothesis，从而达到更好的预测效果。
以上三种投票方式分别对应了机器学习中的三种Aggregation类型，即Uniform Blending、Linear Blending和Any Blending

2. Uniform Blending

分类与回归模型的Uniform Blending

对于多分类模型，Uniform Blending可将得票数最多的那一类作为最终的分类结果，其中 $g_{t}(x)$ 表示我们现有的模型， $G(x)$ 表示混合后的模型：

图片名称

对于回归模型，Uniform Blending将每一个 $g_{t}(x)$ 求平均：

图片名称

Uniform Blending的可行性：

$f(x)$ 表示实际的预测结果， $g_{t}(x)$ 和 $f(x)$ 的平方误差与 $G(x)$ 的联系可通过如下推导得出：

图片名称

$(G-f)^{2}$ 这项表示混合后的模型与真实结果的误差，即Bias； $avg((g_{t}-G)^{2})$ 表示 $g_{t}$ 之间的相异性，即Variance。从推导结果可以看出 $g_{t}(x)$ 与 $G(x)$ 在预测误差上相差了 $avg((g_{t}-G)^{2})$ 这一项，即 $G(x)$ 的误差期望小于或等于任选一个 $g_{t}(x)$ 的误差期望。