StanFord ML 笔记第五部分

2024-05-28 20:08

文章标签 笔记部分第五 ml stanford

本文主要是介绍StanFord ML 笔记第五部分，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1.朴素贝叶斯的多项式事件模型：

　　　　趁热打铁，直接看图理解模型的意思：具体求解可见下面大神给的例子，我这个是流程图。

　　　　

在上篇笔记中，那个最基本的NB模型被称为多元伯努利事件模型(Multivariate Bernoulli Event Model，以下简称 NB-MBEM)。该模型有多种扩展，一种是在上一篇笔记中已经提到的每个分量的多值化，即将p(xi|y)由伯努利分布扩展到多项式分布；还有一种在上一篇笔记中也已经提到，即将连续变量值离散化。本文将要介绍一种与多元伯努利事件模型有较大区别的NB模型，即多项式事件模型(Multinomial Event Model，一下简称NB-MBEM)。

首先，NB-MEM改变了特征向量的表示方法。在 NB-MBEM中，特征向量的每个分量代表词典中该index上的词语是否在文本中出现过，其取值范围为{0,1}，特征向量的长度为词典的大小。而在 NB-MEM中，特征向量中的每个分量的值是文本中处于该分量的位置的词语在词典中的索引，其取值范围是{1,2,...,|V|}，|V|是词典的大小，特征向量的长度为相应样例文本中词语的数目。

形式化表示为：

m个训练样本表示为：{x(i),y(i);i=1,...,m}

x(i)=(x1(i),x2(i),...,xni(i))

表示第i个样本中，共有ni个词，每个词在字典的编号xj(i)。

举例来说，在NB-MBEM中，一篇文档的特征向量可能如下所示：

其在NB-MEM中的向量表示则如下所示

在NB-MEM中，假设文本的生成过程如下：

1、确定文本的类别，比如是否为垃圾文本、是财经类还是教育类；

2、遍历文本的各个位置，以相同的多项式分布生成各个词语，生成词语时相互独立。

由上面的生成过程可知，NB-MEM假设文本类别服从多项式分布或伯努利分布，而词典中所有的词语服从多项式分布。生成过程还可如下解释，即现在类别所服从的多项式分布中选取类别，然后遍历整个文本，在词语所服从的多项式分布中选取词语，放在文本中相应的位置上。

于是，NB-MEM的参数如下所示：

Stanford大学机器学习公开课(六)：朴素贝叶斯多项式模型、神经网络、SVM初步

于是，我们可以得到参数在训练集上的极大似然估计：

Stanford大学机器学习公开课(六)：朴素贝叶斯多项式模型、神经网络、SVM初步

极大化似然估计函数，可以得到各个参数的极大似然估计：

Stanford大学机器学习公开课(六)：朴素贝叶斯多项式模型、神经网络、SVM初步

Stanford大学机器学习公开课(六)：朴素贝叶斯多项式模型、神经网络、SVM初步

Stanford大学机器学习公开课(六)：朴素贝叶斯多项式模型、神经网络、SVM初步

在φk|y=1和φk|y=0 上使用Laplace平滑，得到公式如下：

Stanford大学机器学习公开课(六)：朴素贝叶斯多项式模型、神经网络、SVM初步

Stanford大学机器学习公开课(六)：朴素贝叶斯多项式模型、神经网络、SVM初步

其中，|V|为词典的大小。

与以前的式子相比，分母多了个ni,分子由0/1变成了k。

对于式子

分子的意思是对所有标签为1的邮件求和，即只考虑垃圾邮件，之后对垃圾邮件中的所有词求和，它加起来应该是词k出现在垃圾邮件中的次数。

换句话说，分子实际上就是对训练集合中的所有垃圾邮件中词k出现的次数进行求和。

分母的含义是对训练样本集合进行求和，如果其中的一个样本是垃圾邮件(y=1)，那么就把它的长度加起来，所以分母的含义是训练集合中所有垃圾邮件的总长。

所以这个比值的含义就是在所有垃圾邮件中，词k所占的比例。

举个例子：

Stanford大学机器学习公开课(六)：朴素贝叶斯多项式模型、神经网络、SVM初步

假如邮件中只有a,b,c这三个词，他们在词典的位置分别是1,2,3，前两封邮件都只有两个词，后两封有3个词。

Y=1是垃圾邮件。

那么，

假如新来一封邮件为b,c，那么特征表示为{2,3}

那么

那么该邮件是垃圾邮件概率是0.6。

注意这个公式与朴素贝叶斯的不同在于这里针对整体样本求的φk|y=1 ，而朴素贝叶斯里面针对每个特征求的φxj=1|y=1 ，而且这里的特征值维度是参差不齐的。

2.神经网络

　　这就不说了，很早之前就已经推到过而且写过代码-->>http://www.cnblogs.com/wjy-lulu/p/6547542.html

3.支持向量机

　　以前看过懂了，时间长不用又忘记了，这个等用到再看吧

　　http://www.cnblogs.com/wjy-lulu/p/6979436.html

参考：http://blog.sina.com.cn/s/blog_8a951ceb0102wbbv.html(这里面说的例子很好，我感觉画示意图就行了，再写例子太浪费时间了)

这篇关于StanFord ML 笔记第五部分的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1011562。 23002807@qq.com

相关文章

Python学习笔记之getattr和hasattr用法示例详解

Python学习笔记之getattr和hasattr用法示例详解

《Python学习笔记之getattr和hasattr用法示例详解》在Python中,hasattr()、getattr()和setattr()是一组内置函数,用于对对象的属性进行操作和查询,这篇文章... 目录1.getattr用法详解1.1 基本作用1.2 示例1.3 原理2.hasattr用法详解2.

阅读更多...

一文详解如何在Python中从字符串中提取部分内容

一文详解如何在Python中从字符串中提取部分内容

《一文详解如何在Python中从字符串中提取部分内容》：本文主要介绍如何在Python中从字符串中提取部分内容的相关资料,包括使用正则表达式、Pyparsing库、AST（抽象语法树）、字符串操作... 目录前言解决方案方法一：使用正则表达式方法二：使用 Pyparsing方法三：使用 AST方法四：使用字

阅读更多...

利用Python快速搭建Markdown笔记发布系统

利用Python快速搭建Markdown笔记发布系统

《利用Python快速搭建Markdown笔记发布系统》这篇文章主要为大家详细介绍了使用Python生态的成熟工具,在30分钟内搭建一个支持Markdown渲染、分类标签、全文搜索的私有化知识发布系统... 目录引言：为什么要自建知识博客一、技术选型：极简主义开发栈二、系统架构设计三、核心代码实现（分步解析

阅读更多...

Mysql删除几亿条数据表中的部分数据的方法实现

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

阅读更多...

【学习笔记】陈强-机器学习-Python-Ch15 人工神经网络（1）sklearn

【学习笔记】陈强-机器学习-Python-Ch15 人工神经网络（1）sklearn

系列文章目录监督学习：参数方法【学习笔记】陈强-机器学习-Python-Ch4 线性回归【学习笔记】陈强-机器学习-Python-Ch5 逻辑回归【课后题练习】陈强-机器学习-Python-Ch5 逻辑回归（SAheart.csv）【学习笔记】陈强-机器学习-Python-Ch6 多项逻辑回归【学习笔记及课后题练习】陈强-机器学习-Python-Ch7 判别分析【学

阅读更多...

系统架构师考试学习笔记第三篇——架构设计高级知识（20）通信系统架构设计理论与实践

系统架构师考试学习笔记第三篇——架构设计高级知识（20）通信系统架构设计理论与实践

本章知识考点：第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

阅读更多...

poj 2976 分数规划二分贪心（部分对总体的贡献度） poj 3111

poj 2976 分数规划二分贪心（部分对总体的贡献度） poj 3111

poj 2976：题意：在n场考试中，每场考试共有b题，答对的题目有a题。允许去掉k场考试，求能达到的最高正确率是多少。解析：假设已知准确率为x，则每场考试对于准确率的贡献值为： a - b * x，将贡献值大的排序排在前面舍弃掉后k个。然后二分x就行了。代码： #include <iostream>#include <cstdio>#incl

阅读更多...

论文阅读笔记: Segment Anything

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

阅读更多...

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问线性规划2. 第二问非线性规划非线性规划非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

阅读更多...

【C++学习笔记 20】C++中的智能指针

【C++学习笔记 20】C++中的智能指针

智能指针的功能在上一篇笔记提到了在栈和堆上创建变量的区别，使用new关键字创建变量时，需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时，不必自己去调用delete，甚至不用调用new。智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针，是一种作用域指针，意思是当指针超出该作用域时，会自动调用delete。它名为unique的原因是这个

阅读更多...