【概率论】4-6:协方差和相关性(Covariance and Correlation)

2024-04-17 23:18

本文主要是介绍【概率论】4-6:协方差和相关性(Covariance and Correlation),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原文地址1:https://www.face2ai.com/Math-Probability-4-6-Covariance-and-Correlation转载请标明出处

Abstract: 本文介绍协方差和相关性的基础知识,以及部分性质
Keywords: Covariance,Correlation,Properties of Covariance and Correlation

协方差和相关性

概率论基础知识,基础工具已经进入到后半部分了,接下来后面就是对特定分布的研究和分析了,使用的工具就是我们已经介绍过的这些知识,融汇贯通是所有知识学习的唯一考量,掌握的知识点如果不能融入体系,一个月后就相当于没学过,但是成体系的知识不同,只要有一个根节点,就能联系到整个一颗知识树。

一杯敬朝阳,一杯敬月光

我们前面几个重要的数字特征针对的基本都是单一随机变量,我们很清楚,我们在实际操作中面对的基本都是多随机变量的联合分布,那么我们接下来就想研究下,两个或者多个随机变量之间是怎么互相影响的。
协方差(Covariance),相关性(Correlation)是度量随机变量间独立性的一种数字特征,但是必须注意,这两个数字特征度量的是随机变量之间的 线性相关程度 ,这里要好好注意一下!线性相关程度。
注意,协方差和相关性,只刻画线性相关程度!

协方差 Covariance

当我们将随机变量从一个扩展到多个,前面提到的期望,方差,中值等这些针对单个随机变量的数字特征就只能刻画联合分布的某一边缘分布的性质了。所以我们提出了新的数字特征,这个数字特征能描述两个随机变量之间有没有变化上的关系,比如他们经常同时变大或者变小,或者总是一个变大另一个变小,这种关联的关系。
通过这种数字特征,我们能够在求出若干个这种变量的方差,以及通过已经得到的几个随机变量的结果来预测其他几个。如果确定了这几个随机变量之间的关联,这些似乎都是可行的。

Definition Covariance. Let X X X and Y Y Y be random variables having finite means.Let E ( X ) = μ X E(X)=\mu_X E(X)=μX and E ( Y ) = μ Y E(Y)=\mu_Y E(Y)=μY The covariance of X and Y,which is denoted by C o v ( X , Y ) Cov(X,Y) Cov(X,Y) ,is defined as
C o v ( X , Y ) = E [ ( X − μ X ) ( Y − μ Y ) ] Cov(X,Y)=E[(X-\mu_X)(Y-\mu_Y)] Cov(X,Y)=E[(XμX)(YμY)]
if the expectation exists.

没错我们本章就是在研究期望,所以,本章所有的数字特征都来自期望,期望的存在性也左右了这些数字特征的存在性。
如果 X 和Y的都有有限的方差,那么期望存在,并且 C o v ( X , Y ) Cov(X,Y) Cov(X,Y) 存在且有限,但是正负不受限制,可以是正数,负数,0


举个🌰 :
已知随机变量 X X X Y Y Y 有联合p.d.f.
f ( x , y ) = { 2 x y + 0.5 for  0 ≤ x ≤ 1 and  0 ≤ y ≤ 1 0 otherwise f(x,y)= \begin{cases} 2xy+0.5&\text{ for } 0\leq x\leq 1 \text{ and } 0\leq y\leq 1\\ 0&\text{otherwise} \end{cases} f(x,y)={2xy+0.50 for 0x1 and 0y1otherwise
我们来计算 X X X Y Y Y 的协方差。


首先我们要做的是计算均值,求 μ X , μ Y \mu_X,\mu_Y μX,μY

μ X = ∫ 0 1 ∫ 0 1 [ 2 x 2 y + 0.5 x ] d y d x = ∫ 0 1 [ x 2 + 0.5 x ] d x = 7 12 \begin{aligned} \mu_X&=\int^{1}_{0}\int^{1}_{0}[2x^2y+0.5x]dydx\\ &=\int^{1}_{0}[x^2+0.5x]dx\\ &=\frac{7}{12} \end{aligned} μX=0101[2x2y+0.5x]dydx=01[x2+0.5x]dx=127

同理可以求出 μ Y = 7 12 \mu_Y=\frac{7}{12} μY=127
接下来就是求协方差了:
∫ 0 1 ∫ 0 1 ( x − 7 12 ) ( y − 7 12 ) ( 2 x y + 0.5 ) d y d x \int^{1}_{0}\int^{1}_{0}(x-\frac{7}{12})(y-\frac{7}{12})(2xy+0.5)dydx 0101(x127)(y127)(2xy+0.5)dydx
求积分就不写了,很简单,结果是 C o v ( X , Y ) = 1 144 Cov(X,Y)=\frac{1}{144} Cov(X,Y)=1441

按照定义算肯定不是最优的,有一个公理好像是说你永远不能一下就找到最优方法。计算协方差也是一样的。

Theorem For all random variables X and Y such that σ X 2 < ∞ \sigma^2_{X}<\infty σX2< and σ Y 2 < ∞ \sigma^2_{Y}<\infty σY2< ,
C o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E(XY)-E(X)E(Y) Cov(X,Y)=E(XY)E(X)E(Y)

这个定理是说当两个随机变量都有方差的时候,他们的联合分布的协方差可以用他们的期望来求得,这是个定理,定理都是可以被证明(定义不行)
证明:
C o v ( X , Y ) = E ( X Y − μ X Y − μ Y X + μ X μ Y ) = E ( X Y ) − μ X E ( Y ) − μ y E ( X ) + μ X μ Y ) \begin{aligned} Cov(X,Y)&=E(XY-\mu_X Y-\mu_Y X + \mu_X\mu_Y)\\ &=E(XY)-\mu_X E(Y)-\mu_y E(X) + \mu_X\mu_Y)\\ \end{aligned} Cov(X,Y)=E(XYμXYμYX+μXμY)=E(XY)μXE(Y)μyE(X)+μXμY)
就得到了上面定理的结论,证明过程非常简单。

协方差的的主要用途就是来刻画两个或者多个变量的相关程度,比如两个随机变量同时都变大或者同时都变小,或者一个变大一个变小。
观察定义我们可以注意到,当协方差大于0的时候,一般情况下如果出现了 $ X > \mu_X$ 就基本上会出现 Y > μ Y Y > \mu_Y Y>μY 。是否一定会出现 Y > μ Y Y > \mu_Y Y>μY ?这个是不确定的,但是发生概率极大。
同样的情况适合于协方差是负数,或者$ X < \mu_X$ 的情况
当协方差是0,那么 X X X Y Y Y 对应于其均值的大小变换比较随意,没有太大的一致性.

上面介绍的就是协方差的一些情况,接下来就是相关性的引入。

相关性 Correlation

今天讲解两个数字特征,协方差和相关性,这两个数字特征最终目的一样都是想描述多个变量之间一致性变化的特点,比如,当 X X X 为较大值的时候 Y Y Y 有很大的可能取较大值,注意,我们前面给出的协方差的大小就是这个可能性的一种描述,但是,这个描述也有问题,他不稳定,为啥不稳定,
比如说随机变量 X X X 和随机变量 Y Y Y 他们的协方差是 C o v ( X , Y ) Cov(X,Y) Cov(X,Y) 根据协方差的计算法则,当我们把随机变量变成 2 X 2X 2X Y Y Y 的时候 C o v ( 2 X , Y ) = 2 C o v ( X , Y ) Cov(2X,Y)=2Cov(X,Y) Cov(2X,Y)=2Cov(X,Y) ,但他们的一致性关系应该是不变的,只是对应的随机变量的可能值变化了不少,一致性并不改变,我们需要一种数字特征能描述这种一致性,不因为随机变量伸缩而改变。

Definition Correlation.Let X and Y be random variables with finite variances σ X 2 \sigma^2_{X} σX2 and σ Y 2 \sigma^2_{Y} σY2 ,respectively. Then the correlation of X X X and Y Y Y ,which is denoted by ρ ( X , Y ) \rho(X,Y) ρ(X,Y) ,is defined as follow:
ρ ( X , Y ) = C o v ( X , Y ) σ X 2 σ Y 2 \rho(X,Y)=\frac{Cov(X,Y)}{\sigma_X^2 \sigma_Y^2} ρ(X,Y)=σX2σY2Cov(X,Y)

回想一下,我们似乎见过这种比值形式的定义,没错,4-4中的偏度也是这种定义形式,其给出的解释去除分母上的特征对目标特征的影响,于是我们可以看出,当协方差去除分布离散程度以后,就是我们的相关度特征了。
接着我们有一个重要的不等式需要了解。

Theorem Schwarz Inequality.For all random variables U U U and V V V such that E ( U V ) E(UV) E(UV) exists,
[ E ( U V ) ] 2 ≤ E ( U 2 ) E ( V 2 ) [E(UV)]^2\leq E(U^2)E(V^2) [E(UV)]2E(U2)E(V2)
If,in addition,the right-hand side of [ E ( U V ) ] 2 ≤ E ( U 2 ) E ( V 2 ) [E(UV)]^2\leq E(U^2)E(V^2) [E(UV)]2E(U2)E(V2) is finite,then the two sides of it equal the same value if and only if there are nonzero constants a a a and b b b such that a U + b V = 0 aU+bV=0 aU+bV=0 with probability 1.

首先给出了两个随机变量的期望的相关不等式,我们会在接下来完成证明,但是补充条款更有意思,说的是,小于等于号右边如果是有限的,那么等号成立当且仅当存在非零常数 a a a b b b 使得 a U + b V = 0 aU+bV=0 aU+bV=0 横成立(或者叫做概率为1)

那么我们来证明这个定理。
证明:

  1. 如果 E ( U 2 ) = 0 E(U^2)=0 E(U2)=0 那么 P r ( U = 0 ) = 1 Pr(U=0)=1 Pr(U=0)=1 所以必然有 P r ( U V = 0 ) = 1 Pr(UV=0)=1 Pr(UV=0)=1 那么 E ( U V ) = 0 E(UV)=0 E(UV)=0 于是不等式成立。
  2. 同理可以证明 E ( V 2 ) = 0 E(V^2)=0 E(V2)=0 的情况。
  3. E ( U 2 ) E(U^2) E(U2) 或者 E ( V 2 ) E(V^2) E(V2) 为无限的时候,不等式也成立。
  4. 接下来证明 0 < E ( U 2 ) < ∞ 0 < E(U^2) < \infty 0<E(U2)< , 0 < E ( V 2 ) < ∞ 0 < E(V^2) < \infty 0<E(V2)< 的情况,对于所有的 a a a b b b 那么:
    不等式一:
    0 ≤ E [ ( a U + b V ) 2 ] = a 2 E ( U 2 ) + b 2 E ( V 2 ) + 2 a b E ( U V ) 0\leq E[(aU + bV)^2]=a^2E(U^2)+b^2E(V^2)+2abE(UV) 0E[(aU+bV)2]=a2E(U2)+b2E(V2)+2abE(UV)
    以及,不等式二:
    0 ≤ E [ ( a U − b V ) 2 ] = a 2 E ( U 2 ) + b 2 E ( V 2 ) − 2 a b E ( U V ) 0\leq E[(aU - bV)^2]=a^2E(U^2)+b^2E(V^2)-2abE(UV) 0E[(aUbV)2]=a2E(U2)+b2E(V2)2abE(UV)
    如果 令 a = [ E ( V 2 ) ] 1 / 2 , b = [ E ( U 2 ) ] 1 / 2 a=[E(V^2)]^{1/2},b=[E(U^2)]^{1/2} a=[E(V2)]1/2,b=[E(U2)]1/2 那么就有下面的关系:
    不等式三:
    E ( U V ) ≥ − [ E ( U 2 ) E ( V 2 ) ] 1 / 2 E(UV)\geq -[E(U^2)E(V^2)]^{1/2} E(UV)[E(U2)E(V2)]1/2
    根据不等式二,就有不等式四:
    E ( U V ) ≤ [ E ( U 2 ) E ( V 2 ) ] 1 / 2 E(UV)\leq [E(U^2)E(V^2)]^{1/2} E(UV)[E(U2)E(V2)]1/2
    上面两个不等式,不等式三和不等式四得出定理中的结论。
    不等式中等号成立,当且仅当不等式三和不等式四等号成立,不等式三等号成立,当且仅当不等式一等于0成立,也就是当且仅当 E [ ( a U + b V ) 2 ] = 0 E[(aU+bV)^2]=0 E[(aU+bV)2]=0 成立,当且仅当 a U + b V = 0 aU+bV=0 aU+bV=0 恒成立。
    同理可以得到 a U − b V = 0 aU-bV=0 aUbV=0 恒成立,至此证毕!

Theorem Cauchy-Schwarz Inequality.Let X X X and Y Y Y be random variables with finite variance.Then
[ C o v ( X , Y ) ] 2 ≤ σ X 2 σ Y 2 [Cov(X,Y)]^2\leq \sigma^2_X\sigma^2_Y [Cov(X,Y)]2σX2σY2
and
− 1 ≤ ρ ( X , Y ) ≤ 1 -1\leq \rho(X,Y)\leq 1 1ρ(X,Y)1
Furthermor,the inequality in [ C o v ( X , Y ) ] 2 ≤ σ X 2 σ Y 2 [Cov(X,Y)]^2\leq \sigma^2_X\sigma^2_Y [Cov(X,Y)]2σX2σY2 is an equality if and only if there are nonzero constants a a a and b b b and a constant c c c such that a X + b Y = c aX+bY=c aX+bY=c with probability 1.

Cauchy-Schwarz不等式,柯西是谁不介绍了,Schwarz翻译成中文叫施瓦茨。
这个不等式给出了相关性的关键信息,也就是相关性在 [ − 1 , 1 ] [-1,1] [1,1] 范围内,接下来我们看看如何证明他们:
证明

  1. U = X − μ X U=X-\mu_X U=XμX V = Y − μ Y V=Y-\mu_Y V=YμY
  2. 根据协方差定理 C o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E(XY)-E(X)E(Y) Cov(X,Y)=E(XY)E(X)E(Y) 可以直接得到 [ C o v ( X , Y ) ] 2 ≤ σ X 2 σ Y 2 [Cov(X,Y)]^2\leq \sigma^2_X\sigma^2_Y [Cov(X,Y)]2σX2σY2
  3. 然后就可以得到 − 1 ≤ ρ ( X , Y ) ≤ 1 -1\leq \rho(X,Y)\leq 1 1ρ(X,Y)1 这个结论

这个证明非常简单,只用到了前面协方差的一个计算定理,所以,可见相关性在 [ − 1 , 1 ] [-1,1] [1,1] 之间波动。

Definition Positively/Negatively Correlation/Uncorrelated.It is said that X X X and Y Y Y are positively correlated if ρ ( X , Y ) > 0 \rho (X,Y)>0 ρ(X,Y)>0 ,that X X X and Y Y Y are negatively correlated if ρ ( X , Y ) < 0 \rho(X,Y) < 0 ρ(X,Y)<0 ,and that X X X and Y Y Y are uncorrelated if ρ ( X , Y ) = 0 \rho(X,Y)=0 ρ(X,Y)=0

定义正相关,负相关,还是不相关。

接下来我们就要研究协方差,和相关性的性质了。

相关性和协方差的的性质 Properties of Covariance and Correlation

性质1:独立的随机变量的相关性

If X X X and Y Y Y are independent random varibales with 0 < σ X 2 < ∞ 0<\sigma^2_X<\infty 0<σX2< and 0 < σ Y 2 < ∞ 0<\sigma^2_Y<\infty 0<σY2< ,then
C o v ( X , Y ) = ρ ( X , Y ) = 0 Cov(X,Y)=\rho(X,Y)=0 Cov(X,Y)=ρ(X,Y)=0

证明,如果随机变量 X X X Y Y Y 独立,那么 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y) ,根据定理 C o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E(XY)-E(X)E(Y) Cov(X,Y)=E(XY)E(X)E(Y) C o v ( X , Y ) = 0 Cov(X,Y)=0 Cov(X,Y)=0 那么就有 ρ ( X , Y ) = 0 \rho(X,Y)=0 ρ(X,Y)=0
证毕。

注意注意注意,两个变量独立可以推导出其相关性是0,但是相关性是0并不能推到出随机变量独立。


这里举个例子
随机变量 X , Y X,Y X,Y 的联合分布是在一个圆范围内的均匀分布,可以得到其p.d.f. 是
f ( x ) = { 1 2 π for  x 2 + y 2 ≤ 1 0 otherwise  f(x)= \begin{cases} \frac{1}{2\pi}&\text{for } x^2+y^2 \leq 1\\ 0&\text{otherwise } \end{cases} f(x)={2π10for x2+y21otherwise 
因为随机变量变化范围是个圆而不是矩形,所以很明显 X和Y不独立(参考随机变量的独立性),但是可以计算其协方差为 C o v ( X , Y ) = E [ X Y ] − E [ X ] E [ Y ] = 0 − 0 = 0 Cov(X,Y)=E[XY]-E[X]E[Y]=0-0=0 Cov(X,Y)=E[XY]E[X]E[Y]=00=0 那么其相关性也是 0 ,于是相关的两个随机变量,其协方差,相关性也可以是0.
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DczrKfLV-1592530457499)(https://tony4ai-1251394096.cos.ap-hongkong.myqcloud.com/blog_images/Math-Probability-4-6-Covariance-and-Correlation/circle.png)]


性质2:如果两个随机变量是线性关系,那么相关性为1

Theorem Suppose that X X X is a random variable such that 0 < σ X 2 < ∞ 0<\sigma^2_X<\infty 0<σX2< ,and Y = a X + b Y=aX+b Y=aX+b for some constants a a a and b b b ,where a ≠ 0 a\neq 0 a=0 ,If a > 0 a > 0 a>0 the ρ ( X < Y ) = 1 \rho(X < Y)=1 ρ(X<Y)=1 If a < 0 a < 0 a<0 ,then ρ ( X , Y ) = − 1 \rho(X,Y)=-1 ρ(X,Y)=1

证明:

  1. 如果 y = a x + b y=ax+b y=ax+b
  2. 那么 μ Y = a μ X + b \mu_Y=a\mu_X+b μY=aμX+b , Y − μ Y = a ( X − μ X ) Y-\mu_Y=a(X-\mu_X) YμY=a(XμX)
  3. 根据协方差定义有 C o v ( X , Y ) = a E [ ( X − μ X ) 2 ] = a σ X 2 Cov(X,Y)=aE[(X-\mu_X)^2]=a\sigma^2_X Cov(X,Y)=aE[(XμX)2]=aσX2
  4. 因为有 σ Y = ∣ a ∣ σ X \sigma_Y=|a|\sigma_X σY=aσX 所以定理结论得到证明 (这步可由柯西-施瓦茨不等式得出)
  5. 证毕

这个定理告诉我们,相关性就是衡量两个随机变量的线性相关程度的。越接近线性,相关性的绝对值越接近1,反之越接近0,
注意相关性只用来衡量线性相关。相关性越接近零并不代表随机变量不相关,而是只代表他们不线性相关。

性质三:两个随机变量相加,其协方差和单个变量方差的关系

Theorem If X X X and Y Y Y are random variables such that V a r ( X ) < ∞ Var(X)<\infty Var(X)< and V a r ( Y ) < ∞ Var(Y)<\infty Var(Y)< ,then
V a r ( X + Y ) = V a r ( X ) + V a r ( Y ) − 2 C o v ( X , Y ) Var(X+Y)=Var(X)+Var(Y)-2Cov(X,Y) Var(X+Y)=Var(X)+Var(Y)2Cov(X,Y)

证明:
因为 E [ X + Y ] = μ X + μ Y E[X+Y]=\mu_X+\mu_Y E[X+Y]=μX+μY ,所以
V a r ( X + Y ) = E [ ( X + Y − μ X − μ Y ) 2 ] = E [ ( X − μ X ) 2 + ( Y − μ Y ) 2 + 2 ( X − μ X ) ( Y − μ Y ) ] = V a r ( X ) + V a r ( Y ) + 2 C o v ( X , Y ) \begin{aligned} Var(X+Y)&=E[(X+Y-\mu_X-\mu_Y)^2]\\ &=E[(X-\mu_X)^2+(Y-\mu_Y)^2+2(X-\mu_X)(Y-\mu_Y)]\\ &=Var(X)+Var(Y)+2Cov(X,Y) \end{aligned} Var(X+Y)=E[(X+YμXμY)2]=E[(XμX)2+(YμY)2+2(XμX)(YμY)]=Var(X)+Var(Y)+2Cov(X,Y)
简单的计算,就不啰嗦了。

接着是一个推论,在上面定理成立的情况下,我们有:

Corollary Let a,b and c be constants.Under the conditions of theorem upside
V a r ( a X + b Y + c ) = a 2 V a r ( X ) + b 2 V a r ( Y ) + 2 a b C o v ( X , Y ) Var(aX+bY+c)=a^2Var(X)+b^2Var(Y)+2abCov(X,Y) Var(aX+bY+c)=a2Var(X)+b2Var(Y)+2abCov(X,Y)

还有一种特殊的情况就是
V a r ( X − Y ) = V a r ( X ) + V a r ( Y ) − 2 C o v ( X , Y ) Var(X-Y)=Var(X)+Var(Y)-2Cov(X,Y) Var(XY)=Var(X)+Var(Y)2Cov(X,Y)

性质四:根据性质三推广到多个随机变量的情况:

Theorem If X 1 , … , X n X_1,\dots,X_n X1,,Xn are random variables scuh that V a r ( X i ) < ∞ Var(X_i)<\infty Var(Xi)< for i = 0 , … , n i=0,\dots,n i=0,,n then
V a r ( ∑ i = 1 n X i ) = ∑ i = 1 n V a r ( X i ) + 2 ∑ ∑ i < j C o v ( X i , X j ) Var(\sum^{n}_{i=1}X_i)=\sum^{n}_{i=1}Var(X_i)+2{\sum\sum}_{i<j}Cov(X_i,X_j) Var(i=1nXi)=i=1nVar(Xi)+2i<jCov(Xi,Xj)
这个定理的证明相对要麻烦点,
证明:

  1. 首先
    V a r ( ∑ i = 1 n X i ) = C o v ( ∑ i = 1 n X i , ∑ j = 1 n X j ) = ∑ i = 1 n ∑ j = 1 n C o v ( X i , X j ) Var(\sum^{n}_{i=1}X_i)=Cov(\sum^{n}_{i=1}X_i,\sum^{n}_{j=1}X_j)=\sum^{n}_{i=1}\sum^{n}_{j=1}Cov(X_i,X_j) Var(i=1nXi)=Cov(i=1nXi,j=1nXj)=i=1nj=1nCov(Xi,Xj)
  2. 把上面的求和分成两部分一部分是 i = j i=j i=j 一部分是 i ≠ j i\neq j i=j ,因为 V a r ( x i , x j ) = V a r ( x j , x i ) Var(x_i,x_j)=Var(x_j,x_i) Var(xi,xj)=Var(xj,xi)
    V a r ( ∑ i = 1 n X i ) = ∑ i = 1 n V a r ( X i ) + ∑ ∑ i ≠ j C o v ( X i , X j ) = ∑ i = 1 n V a r ( X i ) + 2 ∑ ∑ i < j C o v ( X i , X j ) \begin{aligned} Var(\sum^{n}_{i=1}X_i)&=\sum^{n}_{i=1}Var(X_i)+{\sum\sum}_{i\neq j}Cov(X_i,X_j)\\ &=\sum^{n}_{i=1}Var(X_i)+2{\sum\sum}_{i<j}Cov(X_i,X_j) \end{aligned} Var(i=1nXi)=i=1nVarXi+i=jCov(Xi,Xj)=i=1nVar(Xi)+2i<jCov(Xi,Xj)

证明过程大致如上所述,很简单的计算过程,如有疑问可以去参考下原文

上述定理得出一个推论

Corollary If X 1 , … , X n X_1,\dots,X_n X1,,Xn are uncorrelated random varibales,then
V a r ( ∑ i = 1 n X i ) = ∑ i = 1 n V a r ( X i ) Var(\sum^{n}_{i=1}X_i)=\sum^{n}_{i=1}Var(X_i) Var(i=1nXi)=i=1nVar(Xi)

总结

今天一下介绍了两个多随机变量的数字特征,所描述的性质类似,但是又各有各的用法,这部分内容在机器学习中非常常见,大家要好好研究,多做练习。
待续。。。

这篇关于【概率论】4-6:协方差和相关性(Covariance and Correlation)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/913131

相关文章

机械学习—零基础学习日志(概率论总笔记5)

引言——“黑天鹅” 要获得95%以上置信度的统计结果,需要被统计的对象出现上千次,但是如果整个样本只有几千字,被统计的对象能出现几次就不错了。这样得到的数据可能和真实的概率相差很远。怎么避免“黑天鹅”? 古德-图灵折扣估计法 在词语统计中,有点词语虽然是出现0次,但是实际的出现概率并不是永远不可能的零。 那需要把一些概率转移给到这些词语。 古德的做法实际上就是把出现1次的单词的总量,给了

【python 相关性分析】Python绘制相关性热力图

在数据分析时,经常会针对两个变量进行相关性分析。在Python中主要用到的方法是pandas中的corr()方法。 corr():如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度,返回DataFrame # -*- coding: utf-8 -*-# 导入包import pandas as pdimport numpy as npimport matplotlib.py

概率论与数理统计(1)

第一节博客已经整理了求导的公式,一些常用的概念。链接如下:高等数学基础(1)-CSDN博客。         第二节博客整理了微积分的公式及其相关概念。链接如下:高等数学基础(2)——微积分-CSDN博客         第三节博客则整理了泰勒公式和拉格朗日公式的相关概念。链接如下:高等数学基础(3)——泰勒公式与拉格朗日-CSDN博客         第四节博客则整理了行

【硬刚ES】ES基础(十八)搜索的相关性算分

本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的ES部分补充。

概率论 --- Uva 11181 Probability|Given

Uva 11181 Probability|Given  Problem's Link:   http://acm.hust.edu.cn/vjudge/problem/viewProblem.action?id=18546   Mean:  n个人去逛超市,第i个人会购买东西的概率是Pi。出超市以后发现有r个人买了东西,问你每个人购买东西的实际概率是多少。   analyse

机械学习—零基础学习日志(概率论总笔记3)

“条件概率”和“本身概率” 对于几乎所有的随机事件来讲,条件概率由于条件的存在,它通常不等于本身的概率。前提条件会影响后续的概率,在一个前提条件下,某个时间发生的概率,我理解,这叫,条件概率。 写成P(事件|条件)的形式。 吴军老师给到的启发:很多人学习别人的经验,用到自己身上就不灵了,原因就是没有搞清楚条件。另一方面,有些原来大家认为不可能做成的事情,一旦条件具备,就成为了大概率事件。

概率论原理精解【11】

文章目录 测度论拓扑基定义性质应用拓扑基生成拓扑的过程1. 拓扑基的定义2. 由拓扑基生成拓扑3. 例子说明 4. 总结例子 子基基础例子构造由子基生成的拓扑基础拓扑子基的定义解释例子总结 子基(subbase)是一个用于生成拓扑的较弱的工具定义构造过程性质示例例子 1: 实数线上的半开区间例子 2: 离散拓扑例子 3: 有限补拓扑 参考文献 测度论 拓扑基 是拓扑学中的一