本文主要是介绍Khan公开课 统计学学习笔记 五 正态分布,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow
也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!
正态分布:二项分布极好的近似
X是随机变量,E(X)是期望值。正态分布(normal distribution)也称为高斯分布(Gaussian distribution),或者钟形曲线(bell curve)。
(x-μ)/σ也称为z score(注意:z score是个通用的概念,包括非正态分布)。因此正态分布公式也可以写为,一眼望去,一堆2:
二项式分布可以很好地用正太分布近似,特别是n越大,越趋于接近。我们用Excel来对两者进行对比,下图是fair coin,即p=0.5的抛投情况,给出n=4和n=10的情况,可以看出n越高,曲线就越趋同。
在一般教科书给出的正态分布中,μ=0,上面的图向左移,呈Y轴对称。标准正态分布(Standard normal distribution),即μ=0,σ=1的正态分布。
正态分布:概率
正态曲线是个连续的曲线,如果某个概率符合正态分布曲线,实际上某个区间的概率为,但很多时候直接(x2-x1)f(X),如果离散值,就是P(X),当然对于雨量这种连续分布只能说是近似,在X2-X1很小的可以。
在EXCEL中,有公式=NORMDIST(x,μ,σ,cumulative),如果cumulative选择FALSE,就是正态函数取值,如果选择TRUE,就是累积分布函数(Cumulative Distribution Function),CDF(x)=,相当于EXCEL的另一函数NORMSDIST(z)。利用EXCEL,无论正太分布的X2和X1取多少,都很容易计算在这个区间内的范围值。
累计分布函数,也可以通过根据z score查z table获得。见:http://en.wikipedia.org/wiki/Z_table
正态分布:z score和经验法则
其中以对称的μ为中心,±σ范围的概率是68.3%。也就是说z=(x-μ)/σ在范围(-1,1)内,概率为68.3%。
也就是说z在范围(-1,1)内,概率为68.3%。
所谓的经验法则(Empirical Rule),也成为68-95-99.7法则,即以μ为中心,落在μ±σ的概率为68%,落在μ±2σ的概率为95%,落在μ±3σ的概率为99.7%。
偏态和峰度
正态分布是对称的,而偏态则不是。下面分别是negative skew和positive skew。
正态分布的Kurtosis(峰度)为0,有些分布突出呈尖形,有些较扁呈圆盾形状,用Kurtosic(峰度)表示,如下,其中黑线为正态分布。
相关链接:我的四方书库
给我老师的人工智能教程打call!http://blog.csdn.net/jiangjunshow
这篇关于Khan公开课 统计学学习笔记 五 正态分布的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!