雷蒙专题

机器学习和数据挖掘(6):雷蒙保罗MAPA泛化理论

泛化理论 上一章中提到的生长函数 mH(N) m_{\mathcal H}(N)的定义:假设空间在 N N个样本点上能产生的最大二分(dichotomy)数量,其中二分是样本点在二元分类情况下的排列组合。 上一章还介绍了突破点(break point)的概念,即不能满足完全分类情形的样本点个数。不存在kk个样本点能够满足完全分类情形,完全二分类情形(shattered)是可分出 2N 2^N种