正态分布?

2024-01-30 00:48
文章标签 正态分布

本文主要是介绍正态分布?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

全是个人理解

正态分布是一种广泛出现的连续概率分布,比如身高,分数

二项分布是离散情况下的概率分布
比如仍硬币,正面的可能性是 p p p,那么仍 n n n 次, x x x 次正面的概率为 ( n x ) p x ( 1 − p ) n − x \binom nxp^x(1-p)^{n-x} (xn)px(1p)nx
容易得到均值 μ = n p \mu=np μ=np,方差 σ 2 = n p ( 1 − p ) \sigma^2=np(1-p) σ2=np(1p)
并且画柱状图画出来就是钟形,而且和正态分布的概率密度函数特别像

对于均值为 μ \mu μ 方差为 σ 2 \sigma^2 σ2 的正态分布长成这个样子
N ( μ , σ 2 ) = 1 2 π σ e − x 2 2 σ 2 N(\mu,\sigma^2)=\frac{1}{\sqrt {2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}} N(μ,σ2)=2π σ1e2σ2x2
接着发现,不妨设二项分布的 p = 1 2 p=\frac 12 p=21,选择一个 n n n,带入 σ 2 = n p ( 1 − p ) = n 4 \sigma^2=np(1-p)=\frac n4 σ2=np(1p)=4n
然后画出图像,是几乎重合的,比如选择 n = 16 n=16 n=16,我们知道 ( 16 8 ) 2 16 = 0.196381 \frac{\binom{16}8}{2^{16}}=0.196381 216(816)=0.196381 是二项分布的最中间的值,而将 x = μ x=\mu x=μ 带入正态分布的函数可以知道这个点的概率密度是 1 2 2 π = 0.1994711 \frac{1}{2\sqrt{2\pi}}=0.1994711 22π 1=0.1994711 是几乎相等的
而这个现象在 n n n 更大的时候更明显(更接近连续)
例如 ( 36 18 ) 2 36 = 0.13206 \frac{\binom{36}{18}}{2^{36}}=0.13206 236(1836)=0.13206,而 1 3 2 π = 0.132981 \frac{1}{3\sqrt {2\pi}}=0.132981 32π 1=0.132981
这启示我们好像可以用 1 n π \sqrt{\frac{1}{n\pi}} nπ1 来估计 ( 2 n n ) 2 2 n \frac{\binom{2n}{n}}{2^{2n}} 22n(n2n)
很牛的是,斯特林公式告诉我们
n ! ∼ 2 π n ( n e ) n n!\sim \sqrt{2\pi n}(\frac{n}{e})^n n!2πn (en)n,如果我们来算一下 ( 2 n n ) 2 2 n ∼ 2 π n ( n e ) 2 n 2 π n ( n e ) 2 n = 1 n π \frac{\binom{2n}{n}}{2^{2n}}\sim\frac{2\sqrt {\pi n}(\frac{n}{e})^{2n}}{2\pi n(\frac{n}{e})^{2n}}=\sqrt{\frac{1}{n\pi}} 22n(n2n)2πn(en)2n2πn (en)2n=nπ1
之前在寻找人们是怎么拟合出正态分布函数的表达式的
就浏览到一个用斯特林公式推的,上面的巧合似乎告诉我们用斯特林公式推挺有道理
还有一种方法
考虑从 [ 0 , 1 ] [0,1] [0,1] 随机一些数出来,随机 n n n 次,然后我们取平均,设为 x 1 x_1 x1
然后我们重复上面过程 m m m 次,把随出来的值(取平均后)看成 x 2 , … , x m x_2,\dots,x_m x2,,xm
m m m 足够大的时候,可以画出来一个概率密度函数,这个函数其实就是正态分布了
就是说在中间的概率要大很多(中心极限定理)
这感觉起来很正确,但为啥函数会长成 e k x 2 e^{kx^2} ekx2 这种鬼样子呢?
我们先设一个函数,将其取名为误差密度函数 f ( x ) f(x) f(x)
∏ i = 1 m f ( x − x i ) \prod_{i=1}^mf(x-x_i) i=1mf(xxi),并且真正的均值 x ‾ \overline x x 是上面这个关于 x x x 函数的极大值点
但经验告诉我们其实均值就是 x ‾ = ∑ x i m \overline x=\frac{\sum x_i}{m} x=mxi
而上面那个函数的极大值点,即 ∑ ln ⁡ f ( x − x i ) \sum \ln f(x-x_i) lnf(xxi) 的极大值点,就是使 ∑ ln ⁡ f ( x − x i ) ′ = ∑ f ′ ( x − x i ) f ( x − x i ) = 0 \sum \ln f(x-x_i)'=\sum \frac{f'(x-x_i)}{f(x-x_i)}=0 lnf(xxi)=f(xxi)f(xxi)=0 的点,设 g i ( x ) = f ′ ( x ) f ( x ) g_i(x)=\frac{f'(x)}{f(x)} gi(x)=f(x)f(x),我们知道 ∑ g i ( x ‾ − x i ) = 0 \sum g_i(\overline x-x_i)=0 gi(xxi)=0
这个意思是说不管任意 x i x_i xi 怎么变,上面都是 0,那么我们分别对 x 1 , … , x m x_1,\dots,x_m x1,,xm 求偏导,那么应该都是 0,可以解出来 g ( x ) = k x g(x)=kx g(x)=kx,我们发现 f ′ ( x ) = k x f ( x ) f'(x)=kxf(x) f(x)=kxf(x),这启示我们 f ( x ) = C e k x 2 2 f(x)=Ce^{\frac{kx^2}{2}} f(x)=Ce2kx2
然后要调整积分为 1,最后就可以得到 f ( x ) = 1 2 π σ e − x 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}} f(x)=2π σ1e2σ2x2
看起来很牛逼,其实上面的 L ( x ) = ∏ f ( x − x i ) L(x)=\prod f(x-x_i) L(x)=f(xxi) 叫似然函数,就是利用均值既是多项的平均,又是似然函数的极值,从而导出 f ( x ) f(x) f(x) 的性质

这篇关于正态分布?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/658633

相关文章

为什么在很多应用中常采用正态分布/高斯分布、中心极限定理

为什么在很多应用中常采用正态分布/高斯分布? 当我们由于缺乏关于某个实数上分布的先验知识而不知道该选择怎么样的形式时,正态分布是默认的比较好的选择,有两个原因: 一,我们想要建模的很多分布的真实情况是比较接近正态分布的。 中心极限定理说明很多独立随机变量的和近似服从正态分布。 二,在具有相同方差的所有可能的概率分布中,正态分布在实数上具有最大的不确定性。 因此,我们可以认为正态分布是对模型加入的

【Tools】什么是正态分布

我们从不正视那个问题 那一些是非题 总让人伤透脑筋 我会期待 爱盛开那一个黎明 一定会有美丽的爱情                      🎵 范玮琪《是非题》 正态分布,也称为高斯分布,是统计学中最为常见的一种分布模型。它的概率密度函数可以用一个钟形曲线来描述,呈现出对称的形态。在正态分布中,均值、标准差以及方差是非常重要的参数。 正态分布的特点包括: 均值(期望值):正态分布

建模杂谈系列249 增量数据的正态分布拟合

说明 从分布开始,分布又要从正态开始 假设有一批数据,只有通过在线的方式增量获得。 内容 1 生成 先通过numpy生成一堆随机数据,从3个正态分布生成,然后拼接起来。 import numpy as npimport matplotlib.pyplot as pltfrom sklearn.mixture import GaussianMixture# 生成示例数据np.

正态分布,泊松分布,指数分布的c/c++代码

https://blog.csdn.net/u012480384/article/details/50838832

什么是正态分布

最重要的连续分布的通用名是概率密度函数,而标准正态分布(Standard Normal Distribution) 是最重要的概率密度函数。这个连续分布之所以重要,我认为是因为它非常常见,换句话说,我们会很常用到它。标准正态分布(Standard Normal Distribution)的英文中的normal有正常,通用等意思,也就是说在生活中有很多东西都具有一般的、通用的模式,这个连续分布可以用

PHP实现正态分布的累积概率函数算法

本文转自http://www.cnblogs.com/itsharehome/p/5305671.html 在实际项目中,遇到需要正态分布算法去计算一个数值在整体的分布区间,例如:  100,90,80,70,60,50,40,30,20,10共10个数,按从高到低的顺序排序,总数的10%分布区域为极高频,总数的30%分布区域为高频,总数的40%分布区域为中频,总数的20%分布区域为低频,比如

整型数组处理算法(一)按照正态分布来排列整型数组元素

题目要求如下: 给定一个数组input[], 如果数组长度n为奇数,则将数组中最大的元素放到output[]数组最中间的位置, 如果数组长度n为偶数,则将数组中最大的元素放到 output[] 数组中间两个位置偏右的那个位置上, 然后再按从大到小的顺序,依次在第一个位置的两边,按照一左一右的顺序,依次存放剩下的数。 这种处理后结果,如果按照元素的值表示一种分布的图形的话,那绘制后的图形

实验七:对比正态分布

2019/04/25 提要 对比正太分布的概率密度函数对比正太分布的累计分布函数循环做图情况下,添加图例 使用函数:scipy.stats.norm scipy.stats.cdf (本部分代码位于250jupyter根目录下dist_plot 2019/04/25) 实验: 对比概率密度函数 概率密度函数 代码使用[2]中。 从图中可以看出,标准差越小,整个图显得越尖;

利用均匀分布和中心极限定理产生正态分布(高斯分布)

中心极限定理: 设随机变量序列 {Xi} \{X_i\}相互独立,具有相同的期望和方差,即 E(Xi)=μ,D(Xi)=σ

正态分布公式

正态分布(也称为高斯分布)的概率密度函数(PDF)公式如下: 对于均值为 (\mu) ,标准差为 (\sigma) 的正态分布,其概率密度函数为: f ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} f(x)=2πσ2