CS224d: Deep Learning for NLP Lecture1 概率复习(1)

2023-12-28 02:58

本文主要是介绍CS224d: Deep Learning for NLP Lecture1 概率复习(1),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

因为平时考试,我的报告分数特别低,主要是因为我的英文写作能力特别差,为了练习英文写作,部分博客(比较简单的内容)将用英文写作,望大家闲来无聊时,看看我的博客,指正错误。


Abstract

The main content is the review of cumulative distribution functions(CDFs), probability mass functions(PMFs) and probability density functions(PDFs).

Axioms of Probability

  • P(A)0, for all A, is a set of events
  • P(Ω)=1, Ω represents a sample space
  • If A1,A2,... are disjoint events, then P(iAi)=iP(Ai)

Conditional Probability and Independence

The conditional probability of any event A given B is defined as,

P(A|B)=P(AB)P(B)
P(A|B) means the probability measure of A when the event B occurs. We can see the event B as a universal set. Two events are called independent if and only if P(AB)=P(A)P(B) or P(A|B)=P(A) . Therefore, independence is equivalent to saying that observing B does not have any effect on the probability of A.

Random Variables

We denote random variables using upper case letters X(ω) or simply X . We denote the value that a random variable may take on using lower case letter x. Random variables are divided into discrete random variable and continuous random variable. When X can take on only a finite number of values, it is known as a discrete random variable. The probability of the set associated with a random variable X taking on some specific value k is:

P(X=k)=P({ω:X(ω)=k})
When X can take on a infinite number of possible values, it is called a continuous random variable. The probability that X takes on a value between two real constants a and b is:

P(aXb)=P({ω:aX(ω)b})

Cumulative Distribution Functions

A cumulative distribution function is a function FX:[0,1] which specifies a probability measure as,

FX(x)=P(Xx)
Properties:
- 0FX(x)1
- limxFX(x)=0
- limxFX(x)=1
- xyFX(x)FX(y)

Probability Mass Functions

When X is a discrete random variable, a simpler way to represent the probability of a random variable is to directly specify the probability of each value that the random variable can assume. A probability mass function is a function pX:Ω such that:

pX(x)=P(X=x)
The notation Val(X) is the set of possible values that the random variable X may assume.
Properties:
- 0pX(x)1
- xVal(X)pX(x)=1
- xApX(x)=P(XA)

Probability Density Functions

The CDF FX(x) is differentiable everywhere for some continuous random variables. The probability density functions is the derivative of the CDF:

fX(x)=dFX(x)dx
According to the properties of differentiation, for very small x , P(xXx+x)fX(x)x
Properties:
- fX(x)0
- fX(x)=1
- xAfX(x)dx=P(XA)

Reference:http://cs229.stanford.edu/section/cs229-prob.pdf

这篇关于CS224d: Deep Learning for NLP Lecture1 概率复习(1)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/544923

相关文章

hdu4865(概率DP)

题意:已知前一天和今天的天气概率,某天的天气概率和叶子的潮湿程度的概率,n天叶子的湿度,求n天最有可能的天气情况。 思路:概率DP,dp[i][j]表示第i天天气为j的概率,状态转移如下:dp[i][j] = max(dp[i][j, dp[i-1][k]*table2[k][j]*table1[j][col] )  代码如下: #include <stdio.h>#include

【408数据结构】散列 (哈希)知识点集合复习考点题目

苏泽  “弃工从研”的路上很孤独,于是我记下了些许笔记相伴,希望能够帮助到大家    知识点 1. 散列查找 散列查找是一种高效的查找方法,它通过散列函数将关键字映射到数组的一个位置,从而实现快速查找。这种方法的时间复杂度平均为(

简单的Q-learning|小明的一维世界(3)

简单的Q-learning|小明的一维世界(1) 简单的Q-learning|小明的一维世界(2) 一维的加速度世界 这个世界,小明只能控制自己的加速度,并且只能对加速度进行如下三种操作:增加1、减少1、或者不变。所以行动空间为: { u 1 = − 1 , u 2 = 0 , u 3 = 1 } \{u_1=-1, u_2=0, u_3=1\} {u1​=−1,u2​=0,u3​=1}

简单的Q-learning|小明的一维世界(2)

上篇介绍了小明的一维世界模型 、Q-learning的状态空间、行动空间、奖励函数、Q-table、Q table更新公式、以及从Q值导出策略的公式等。最后给出最简单的一维位置世界的Q-learning例子,从给出其状态空间、行动空间、以及稠密与稀疏两种奖励函数的设置方式。下面将继续深入,GO! 一维的速度世界 这个世界,小明只能控制自己的速度,并且只能对速度进行如下三种操作:增加1、减

计算机基础知识复习9.6

点对点链路:两个相邻节点通过一个链路相连,没有第三者 应用:PPP协议,常用于广域网 广播式链路:所有主机共享通信介质 应用:早期的总线以太网,无线局域网,常用于局域网 典型拓扑结构:总线型 星型(逻辑总线型) 介质访问控制  静态划分信道 信道划分介质访问控制 频分多路复用FDM 时分多路复用TDM 波分多路复用WDM 码分多路复用CDM 动态分配信道 轮询访问介质访问控

概率DP (由一道绿题引起的若干问题。目前为一些老题,蒟蒻的尝试学习1.0)

概率DP: 利用动态规划去解决 概率 期望 的题目。 概率DP 求概率(采用顺推) 从 初始状态推向结果,同一般的DP类似,只是经历了概率论知识的包装。 老题: 添加链接描述 题意: 袋子里有w只白鼠,b只黑鼠,A和B轮流从袋子里抓,谁先抓到白色谁就赢。A每次随机抓一只,B每次随机 抓完一只后 会有另外一只随机老鼠跑出来。如果两个人都没有抓到白色,那么B赢。A先抓,问A赢得概率。 w b 均在

2024国赛论文拿奖快对照这几点及评阅要点,勿踩雷区!(国赛最后冲刺,提高获奖概率)

↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑ 2024“高教社杯”全国大学生数学建模竞赛已过去第三个夜晚,小伙伴们都累了没有,如果感到思维滞涩,别忘了稍作休息,放松一下自己,准备迎接国赛非常重要的收尾阶段——论文。 国赛这几天的努力最后都

【抽代复习笔记】28-群(二十二):四道子群例题

例1:证明,循环群的子群是循环群。 证:设G = (a),H ≤ G。 (1)若H = {e},则H是一阶循环群; (2)设H至少包含2个元素,即设H = {...,a^(-k),a^(-j),a^(-i),a^0,a^i,a^j,a^k,...}, 其中a^i是H中正指数最小的元素,0<i<j<k, 下证a^i是H的生成元: 对任意的a^t∈H(t∈Z),存在q∈Z,使得t = qi

Deep Ocr

1.圈出内容,文本那里要有内容.然后你保存,并'导出数据集'. 2.找出deep_ocr_recognition_training_workflow.hdev 文件.修改“DatasetFilename := 'Test.hdict'” 310行 write_deep_ocr (DeepOcrHandle, BestModelDeepOCRFilename) 3.推理test.hdev

西方社会学理论教程复习重点

一.名词解释 1.社会静力学:旨在揭示人类社会的基本秩序。它从社会的横断面,静态的考察人类社会的结构和制度,寻找确立和维护人类社会的共存和秩序的原则。 2.社会动力学:纵观人类理性和人类社会发展的先后必要阶段,所叙述的是这一基本秩序在达到实证主义这一最终阶段之前所经过的曲折历程。 3.社会事实:一切行为方式,不论它是固定的还是不固定的,凡是能从外部给予个人以约束的,或者说是普遍存在于该社会各