《随机变量及其分布》_2021秋季《概率论与数理统计》复习笔记2.0

《随机变量及其分布》_2021秋季《概率论与数理统计》复习笔记2.0_基于浙大第五版和华东师大版

本文主要是介绍《随机变量及其分布》_2021秋季《概率论与数理统计》复习笔记2.0_基于浙大第五版和华东师大版，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

说明

主要基于浙大第五版
并非详细教程笔记，仅作梳理用（教程性笔记可移步另一篇博客）
偏重概念理解和澄清误区

注意大小写字母的区分，例如 $X$ （随机变量）和 $x$ （实数或分布函数的自变量）、 $P$ （概率）和 $p$ （分布律）等，手写时需要自己能分清。

随机变量及其分布

随机变量的取值随试验结果而定，在试验之前不能预知它取什么值。

一个事件尽管在一次试验中发生的概率很小，但只要试验次数很多，且试验独立进行，那么这一事件的发生几乎是肯定的，所以绝不能轻视小概率事件。

分布函数

对于非离散型随机变量，我们更关注随机变量的取值落在某个区间的概率 $P\{x_1<X\leq x_2\}$ ，而不是某个值的概率。由于
$P\{x_1<X\leq x_2\}=P\{X\leq x_2\}-P\{X\leq x_1\}$
我们为了研究 $P\{X\leq x\}$ ，引入分布函数的概念。

（离散型随机变量同样可以使用分布函数）
性质
1. 不减
2. $0\leq F(x)\leq 1,F(-\infin)=0,F(\infin)=1$
3. 右连续
具备这三条性质的函数必是某个随机变量的分布函数
连续型随机变量的分布函数是连续函数

概率密度函数

基于3b1b，类似于微积分的理解

性质
1. $f(x)\geq 0$
2. $\int_{-\infin}^{+\infin}f(x){\rm d}x=1$
3. $P\{x_1<X\leq x_2\}=\int_{x_1}^{x_2}f(x){\rm d}x$
4. 若 $f (x)$ 在 $x$ 连续，则有 $F^{'} (x) = f (x)$
若 $f (x)$ 具备性质 $1, 2$ ，引入 $G(x)=\int_{-\infin}^xf(t){\rm d}t$ ，则 $G (x)$ 是某一随机变量的分布函数， $f (x)$ 是该随机变量的概率密度
在计算连续型随机变量落在某一区间的概率时，不必区分区间开闭。
如何理解概率密度

个人认为依然可以延续先前研究分布函数时提到的“关注随机变量的取值落在某个区间的概率”的思想，
$P\{x_1<X\leq x_2\}=F(x+\Delta x)-F(x)=f(x)\Delta x$
类似于线密度的定义，在一段很小的 $\Delta x$ 内，取 $f(x)=\frac{P\{x_1<X\leq x_2\}}{\Delta x}$ 作为小区间 $(x,x+\Delta x)$ 上的概率密度。在将柱划分得更细的过程中，落在该区间中的概率越小，而这种概率上的变小可以通过基本维持 $f (x)$ 的高度、同时缩小 $\Delta x$ 实现。
- $f (x)$ 并不代表 $P (X = x)$ 这一点的概率（ $P (X = x) = 0$ ，因为线的面积是 $0$ ）。
  
  由于连续型随机变量的区间概率计算与离散型不同， $P(x\in D)\ne\sum_{x\in D} P(x)$ ，即 $P(x\in D)$ 本身就是基本的研究对象，所以“无限个 $0$ 相加等于 $1$ ”（ $\forall x\in D,P(X=x)=0$ ，然而 $P(X\in D)=1$ ）的悖论，就被 $P(X\in D)=S=\sum S_i$ 这样面积的累加绕开了。
  
  更多相关内容可学习测度论勒贝格积分
“概率为 $0$ 的事件可能会发生”

从理解的角度，概率密度函数和可能性的关系更大，而不是和概率。可以拿3b1b视频中的例子，P(H)精确等于0.7的概率为0，但可能性依然存在。

于是，不可能事件 $A$ 的概率 $P (A) = 0$ ，但若 $P (A) = 0$ ， $A$ 不一定是不可能事件。
对于概率密度函数是偶函数的情况，有
$F (- a) + F (a) = 1$
从面积角度理解， $F(-a)=\int_{-\infin}^{-a}f(x)dx=\int_a^{+\infin}f(x)dx$ ，这块面积与 $F (a)$ 代表面积之和即为整个PDF覆盖的面积。
随机变量 $X$ 的函数的分布

函数 $g (x)$ 满足 $\forall x\in D,g'(x)>0(或恒<0)$ ，则 $Y = g (X)$ 是连续型随机变量，pdf为
$f_Y(y)= \begin{cases} f_X[h(y)]|h'(y)|,& \alpha<y<\beta \\ 0, & 其他 \end{cases}$
$h (y)$ 为 $g (x)$ 的反函数， $\alpha\beta$ 易得。
- 关键在于将 $F (y)$ 转化为 $P(Y\leq y)$ ，进而转化为 $P(g(X)\leq y)$ ，变换得到 $F (X)$ ，再将处理后的式子对 $y$ 进行求导