layout | title | date | categories | tags | comments | mathjax | copyrights |
---|---|---|---|---|---|---|---|
post |
概率论笔记 |
2020-03-01 00:00:00 +0800 |
数学 |
note probability |
true |
true |
原创 |
本文为概率论笔记。
-
概念:
-
确定现象 / 随机现象 / 模糊现象
-
随机试验(E)
-
随机事件(基本事件 / 样本空间) / 必然事件 / 不可能事件
-
对立事件:
$$A\cup B=\Omega, AB=\varnothing$$
-
-
运算规律:
-
交换律
$$A\cup B=B\cup A$$ $$AB=BA$$ -
结合律
$$\left(A\cup B\right)\cup C=A\cup \left(B\cup C\right)=A\cup B\cup C$$ $$\left(AB\right)C=A\left(BC\right)=ABC$$ -
分配律
$$\left(A\cap B\right)\cup C=\left(A\cup C\right)\cap\left(B\cup C\right)$$ $$\left(A\cup B\right)\cap C=\left(A\cap C\right)\cup\left(B\cap C\right)$$ -
摩根公式
$$\overline{A\cup B}=\overline{A}\cap\overline{B}$$ $$\overline{A\cap B}=\overline{A}\cup\overline{B}$$
-
如果在
-
全概率公式
设随机试验
$$E$$ 的事件组$$A_1,A_2,\cdots$$ 是样本空间$$\Omega$$ 的一组划分(有穷或无穷),假定对于每一个$$i$$ ,$$P\left(A_i\right)>0$$,则对于任意事件$$B$$ ,$$P\left(B\right)=\sum_{i=1}^{n}{P\left(A_i\right)P\left(B\mid A_i\right)}$$ -
贝叶斯公式
设随机试验
$$E$$ 的事件组$$A_1,A_2,\cdots$$ 是样本空间$$\Omega$$ 的一组划分(有穷或无穷),假定对于每一个$$i$$ ,$$P\left(A_i\right)>0$$,则对于任意事件$$B$$ ,只要$$P\left(B\right)>0$$ ,有$$P\left(A_i\mid B\right)=\frac{P\left(A_i B\right)}{P\left(B\right)}=\frac{P\left(A_i\right)P\left(B \mid A_i\right)}{\sum_{k=1}^{n}{P\left(A_k\right)P\left(B\mid A_k\right)} }$$
若
-
独立扩张定理
事件
$$A_1,A_2,\cdots,A_n$$ 相互独立,将任意多个事件替换成它们各自的对立事件后,任然是$$n$$ 个相互独立的事件
设
设
-
分布函数的定义域为一切实数
-
分布函数在
$$x$$ 处的取值所表示的是随机变量$$X$$ 在$$\left(-\infty,x\right]$$ 上的概率 -
性质:
-
单调不减,若
$$x_1<x_2$$ ,则$$F\left(x_1\right)\leq F\left(x_2\right)$$ -
$$0\leq F\left(x\right)\leq1, F\left(-\infty\right)=0, F\left(+\infty\right)=1$$ -
右连续,$$F\left(x+0\right)=F\left(x\right)$$
-
-
常用公式:
-
$$P\left(X\leq b\right)=F\left(b\right)$$ -
$$P\left(a\leq X\leq b\right)=F\left(b\right)=F\left(a\right)$$ -
$$P\left(X>b\right)=1-F\left(b\right)$$ -
$$P\left(X<b\right)=F\left(b-0\right)$$ -
$$P\left(X=b\right)=F\left(b\right)-F\left(b-0\right)$$
-
-
分布列 / 分布律:
$$P\left(X=x_k\right)=p_k$$ $$X$$ $$x_1$$ $$x_2$$ $$\cdots$$ $$x_k$$ $$\cdots$$ $$P$$ $$p_1$$ $$p_2$$ $$\cdots$$ $$p_k$$ $$\cdots$$ -
分布函数:
$$F\left(x\right)=P\left(X\leq x\right)=\sum_\limits{x_k\leq x}{p_k}$$ $$\left(0-1\right)$$ 分布:$$P\left(X=x\right)=p^x {\left(1-p\right)}^{1-x}, x=0,1$$ -
二项分布:
把试验
$$E$$ 在相同的条件下重复进行$$n$$ 次各次试验的结果有限且互不影响,则称这$$n$$次试验为$$n$$ 次独立试验如果每次试验只有两个结果,则
$$n$$ 次独立试验又称为$$n$$ 重贝努里试验$$X$$ 为$$n$$ 重贝努里试验中成功的次数,$$P\left(X=k\right)=C_{n}^{k}p^k{\left(1-p\right)}^{n-k}, k=0,1,2,\cdots ,n$$ 记为
$$X\sim B\left(n,p\right)$$ 当
$$k$$ 为最可能成功的次数时,称$$P\left(X=k\right)$$ 为二项分布的中心项 -
泊松分布:
$$P\left(X=k\right)=\frac{ {\lambda}^k}{k!}e^{-\lambda}, k=0,1,2,\cdots ,\lambda>0$$ 记为
$$X\sim P\left(\lambda\right)$$ -
$$B\left(n,p\right)$$ 中$$n$$ 较大,$$p$$ 较小时,趋近于泊松分布,$$\lambda=np$$
-
-
超几何分布:
$$P\left(X=k\right)=\frac{C_{M}^{k}C_{N_M}^{n-k} }{C_{N}^{n} }, k=0,1,2,\cdots,\min\left{n,M\right}$$ 记为
$$X\sim H\left(N,M,n\right)$$ -
几何分布:
$$P\left(X=k\right)=pq^{k-1}, k=1,2,3,\cdots$$ 记为
$$X\sim G\left(P\right)$$ -
负二项分布 / 帕斯卡分布:
$$P\left(X=k\right)=C_{r-1}^{k-1}p^r{\left(1-p\right)}^{k-r}, k=r,r+1,\cdots$$ 记为
$$X\sim NB\left(r,p\right)$$
若存在非负可积函数
-
$$f\left(x\right)\geq0,x\in\mathbb{R}$$ -
$$\int_{-\infty}^{+\infty}{f\left(x\right)\mathbf{d}x}=1$$ -
$$F^{\prime}\left(x\right)=f\left(x\right)$$ -
$$P\left(X=x_0\right)=0$$ -
$$P\left(X\in I\right)=\int_{I}{f\left(x\right)\mathbf{d}x}$$ -
均匀分布:
$$f\left(x\right)=\left{ \begin{array}{lr} \frac{1}{b-a} &a\leq x\leq b\ 0 &其它 \end{array} \right.$$
记为
$$X\sim U\left[a,b\right]$$ -
指数分布:
$$f\left(x\right)=\left{ \begin{array}{lr} \lambda e^{-\lambda x} &x>0\ 0 &x\leq0 \end{array} \right.$$
记为
$$X\sim e\left(\lambda\right)$$ $$P\left(X>n+k\mid X>n\right)=P\left(X>k\right)$$ -
正态分布:
$$f\left(x\right)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{ {\left(x-\mu\right)}^2}{2{\sigma}^2} }$$ 记为
$$X\sim N\left(\mu,{\sigma}^2\right)$$ -
当
$$x=\mu$$ 时曲线处于最高点$$\sigma$$ 越大,曲线越矮胖 -
$$N\left(0,1\right)$$ 为标准正态分布 -
设
$$X\sim N\left(\mu,{\sigma}^2\right)$$ ,则$$Y=\frac{X-\mu}{\sigma}\sim N\left(0,1\right)$$ $$F\left(x\right)=P\left(X\leq x\right)=P\left(\frac{X-\mu}{\sigma}\leq\frac{x-\mu}{\sigma}\right)=\Phi\left(\frac{x-\mu}{\sigma}\right)$$ -
$$\Phi\left(-x\right)=1-\Phi\left(x\right)$$
-
-
$$\alpha$$ 分位点$$x_a$$ :$$P\left(X>x_a\right)=\alpha$$
已知随机变量
-
$$X$$ 为离散型随机变量 -
$$X$$ 为连续型随机变量-
设
$$X$$ 的密度函数为$$f_{X}\left(x\right)$$ ,则随机变量$$Y=g\left(X\right)$$ 的分布函数为$$F_{Y}{\left(y\right)}=P\left(Y\leq y\right)=P\left(g\left(X\right)\leq y\right)=\int_{g\left(x\right)\leq y}{f_{X}{\left(x\right)}\mathrm{d}x}$$
$$f_{Y}{\left(y\right)}=\frac{\mathrm{d} }{\mathrm{d}y}F_{Y}{\left(y\right)}$$ -
设
$$X$$ 的概率密度函数为$$f_{X}{\left(x\right)}$$ ,若$$g^{\prime}{\left(x\right)}>0$$ 或$$g^{\prime}{\left(x\right)}<0$$ ,记$$x=h\left(y\right)$$ 为$$y=g\left(x\right)$$ 的反函数,则$$Y=g\left(X\right)$$ 概率密度为$$f_{Y}{\left(y\right)}=\left{ \begin{array}{lr} f_{X}{\left(h\left(y\right)\right)}\lvert h^{\prime}{\left(y\right)}\rvert &y\in g\left(R\right)\ 0 &\text{其它} \end{array} \right.$$
其中
$$g\left(R\right)=\left{g\left(x\right)\mid x\in R\right}$$ 为$$g\left(x\right)$$ 的值域
-
设
-
联合分布函数
$$F\left(x,y\right)=P\left(X\leq x,Y\leq y\right)$$ -
$$0\leq F\left(x,y\right)\leq1$$ ,$$F\left(-\infty,y\right)=0$$ ,$$F\left(x,-\infty\right)=0$$ ,$$F\left(-\infty,-\infty\right)=0$$ ,$$F\left(+\infty,+\infty\right)=1$$ ; -
$$F\left(x_1,y\right)\leq F\left(x_2,y\right) x_1<x_2$$ ,$$F\left(x,y_1\right)\leq F\left(x,y_2\right) y_1<y_2$$ ; -
$$F\left(x,y\right)=F\left(x+0,y\right)$$ ,$$F\left(x,y\right)=F\left(x,y+0\right)$$ ; -
$$P\left(x_1<X\leq x_2,y_1<Y\leq y_2\right)=F\left(x_2,y_2\right)-F\left(x_2,y_1\right)+F\left(x_1,y_1\right)-F\left(x_1,y_2\right)$$ .
-
-
二维离散型随机变量
-
$$p_{ij}\geq0$$ -
$$\sum_\limits{i}{\sum_\limits{j}{p_{ij} }}=1$$ -
$$F\left(x,y\right)=\sum_\limits{x_i\leq i}{\sum_\limits{y_j\leq j}{p_{ij} }}$$
-
-
连续型二维变量
$$F\left(x,y\right)=\int_{-\infty}^{y}{\int_{-\infty}^{x}{f\left(x,y\right)\mathrm{d}x\mathrm{d}y} }$$ -
$$f\left(x,y\right)\geq0$$ -
$$\int_{-\infty}^{+\infty}{\int_{-\infty}^{+\infty}{f\left(x,y\right)\mathrm{d}x\mathrm{d}y} }=1$$ -
$$f\left(x,y\right)=\frac{ {\partial^{2}{F\left(x,y\right)} }}{\partial{x}\partial{y} }$$ -
设
$$G$$ 为平面$$xy$$ 上的一个区域,则$$P\left{\left(X,Y\right)\in G\right}=\iint_\limits{G}{f\left(x,y\right)\mathrm{d}x\mathrm{d}y}$$
-
-
二维均匀分布
设
$$G$$ 为平面$$xy$$ 上的一个区域,$$S$$ 是$$G$$ 的面积,则$$f\left(x,y\right)=\left{ \begin{array}{lr} \frac{1}{S} &\left(x,y\right)\in G\ 0 &\left(x,y\right)\not\in G \end{array} \right.$$
-
二维正态分布
$$f\left(x,y\right)=\frac{1}{2\pi {\sigma}_1{\sigma}_2\sqrt{1-r^2} }\exp{\left[-\frac{1}{2\left(1-r^2\right)}\left(\frac{ {\left(x-{\mu}1\right)}^2}{ {\sigma}{1}^{2} }-2r\frac{\left(x-\mu_1\right)\left(y-\mu_2\right)}{\sigma_1\sigma_2}+\frac{ {\left(y-{\mu}2\right)}^2}{ {\sigma}{2}^{2} }\right)\right]}$$
$$-\infty<\mu_1,\mu_2<+\infty,\sigma_1>0,\sigma_2>0,\lvert r\rvert <1$$ 记作
$$\left(X,Y\right)\sim N\left(\mu_1,\sigma_1^2;\mu_2,\sigma_2^2;r\right)$$ -
$$\Gamma$$ 函数$$\Gamma\left(\alpha\right)=\int_{0}^{+\infty}{x^{\alpha-1}e^{-x}\mathrm{d}x},\alpha>0$$ $$\Gamma\left(\alpha+1\right)=\alpha\Gamma\left(\alpha\right)$$
-
定义
$$F_{1}{\left(x\right)}=F_{X}{\left(x\right)}=F{\left(x,+\infty\right)}$$ $$F_{2}{\left(y\right)}=F_{Y}{\left(y\right)}=F{\left(+\infty,y\right)}$$ -
边缘分布率
若联合分布律为
$$P\left(X=x_i,Y=y_i\right)=p_{ij},i,j=1,2,\cdots$$ ,则$$X$$ 的边缘分布率$$P\left(X=x_i\right)=\sum_{j=1}^{\infty}{p_{ij} }=p_i,i=1,2,\cdots$$ $$Y$$ 的边缘分布率$$P\left(Y=y_j\right)=\sum_{i=1}^{\infty}{p_{ij} }=p_j,j=1,2,\cdots$$ -
边缘概率密度
$$f_{X}{\left(x\right)}=\int_{-\infty}^{+\infty}{f\left(x,y\right)\mathrm{d}y}$$ $$f_{Y}{\left(y\right)}=\int_{-\infty}^{+\infty}{f\left(x,y\right)\mathrm{d}x}$$
-
定义
-
连续型随机变量
$$F_{Y\mid X}{\left(y\mid x\right)}=P\left(Y\leq y\mid X=x\right)=\frac{P\left(X=x,Y\leq y\right)}{P\left(X=x\right)}=\lim_\limits{\alpha \rightarrow0}{\frac{F\left(x,y\right)-F\left(x-\alpha,y\right)}{F\left(x,+\infty\right)-F\left(x-\alpha,+\infty\right)} }$$ -
离散型随机变量
$$P\left(Y=j\mid X=i\right)=\frac{P\left(X=i,Y=j\right)}{P\left(X=i\right)}=\frac{p_{ij} }{p_i\cdot}$$
-
-
条件概率密度
$$f_{Y\mid X}{\left(y\mid x\right)}=\frac{f\left(x,y\right)}{f_{X}{\left(x\right)} }$$
-
定义
若
$$F\left(x,y\right)=F_{X}{\left(x\right)}\cdot F_{Y}{\left(y\right)}$$ ,则称$$X$$ 和$$Y$$ 是相互独立的 -
充要条件
-
$$P\left(X=x_i,Y=y_i\right)=P\left(X=x_i\right)P\left(Y=y_i\right)$$ -
$$f\left(x,y\right)=f_{X}{\left(x\right)}f_{Y}{\left(y\right)}$$
-
-
定义
-
联合分布函数
$$F\left(x_1,\cdots,x_n\right)=P\left(X_1\leq x_1,\cdots,X_n\leq x_n\right)$$ -
联合分布律
$$P\left(X_1=x_{i}^{\left(1\right)},\cdots,X_n=x_{j}^{\left(n\right)}\right)=p_{i\cdots j}$$ -
联合概率密度
$$F\left(x_1,\cdots,x_n\right)=\int_{-\infty}^{x_1}{\cdots{\int_{-\infty}^{x_n}{f\left(x_1,\cdots,x_n\right)\mathrm{d}x_1} }\cdots \mathrm{d}x_n}$$
-
-
二维连续型随机变量
$$Z=g\left(X,Y\right)$$ -
分布函数
$$F_{Z}{\left(z\right)}=P\left(Z\leq z\right)=P\left(g\left(X,Y\right)\leq z\right)=\iint_\limits{g\left(x,y\right)\leq z}{f\left(x,y\right)\mathrm{d}x\mathrm{d}y}$$ -
概率密度
$$f_{Z}{\left(z\right)}=\frac{\mathrm{d} }{\mathrm{d}z}F_{Z}{\left(z\right)}$$ -
卷积公式
$$f_{X}\cdot f_{Y}=f_{Z}{\left(z\right)}=\int_{-\infty}^{+\infty}{f_{X}{\left(x\right)}f_{Y}{\left(z-x\right)\mathrm{d}x} }=\int_{-\infty}^{+\infty}{f_{X}{\left(z-y\right)}f_{Y}{\left(y\right)\mathrm{d}y} }$$
-
-
定义
-
设离散型随机变量
$$X$$ 的分布律为$$P\left(X=x_i\right)=p_i,i=1,2,\cdots$$ ,若级数$$\sum_\limits{i=1}^{\infty}{\lvert x_i\rvert p_i}$$ 收敛,则$$X$$ 的数学期望存在,$$EX=\sum_\limits{i=1}^{\infty}{x_ip_i}$$ -
设连续型随机变量
$$X$$ 的分布律为$$f\left(x\right)$$ ,若积分$$\int_{-\infty}^{+\infty}{\lvert x\rvert f\left(x\right)\mathrm{d}x}$$ 收敛,则$$X$$ 的数学期望存在,$$EX=\int_{-\infty}^{+\infty}{xf\left(x\right)\mathrm{d}x}$$
-
-
常见数学期望
-
$$\left(0,1\right)$$ 分布$$EX=p$$ -
二项分布
$$B\left(n,p\right)$$ $$P\left(X=k\right)=C_{n}^{k}p^k{\left(1-p\right)}^{n-k}, k=0,1,2,\cdots ,n$$ $$EX=np$$ -
泊松分布
$$P\left(\lambda\right)$$ $$P\left(X=k\right)=\frac{ {\lambda}^k}{k!}e^{-\lambda}, k=0,1,2,\cdots ,\lambda>0$$ $$EX=\lambda$$ -
几何分布
$$G\left(p\right)$$ $$P\left(X=k\right)=pq^{k-1}, k=1,2,3,\cdots$$ $$EX=\frac{1}{p}$$ -
超几何分布
$$H\left(N,M,n\right)$$ $$P\left(X=k\right)=\frac{C_{M}^{k}C_{N_M}^{n-k} }{C_{N}^{n} }, k=0,1,2,\cdots,\min\left{n,M\right}$$ $$EX=\frac{nM}{N}$$ -
均匀分布
$$U\left(a,b\right)$$ $$f\left(x\right)=\left{ \begin{array}{lr} \frac{1}{b-a} &a\leq x\leq b\ 0 &其它 \end{array} \right.$$
$$EX=\frac{a+b}{2}$$ -
指数分布
$$e\left(\lambda\right)$$ $$f\left(x\right)=\left{ \begin{array}{lr} \lambda e^{-\lambda x} &x>0\ 0 &x\leq0 \end{array} \right.$$
$$EX=\frac{1}{\lambda}$$ -
正态分布
$$N\left(\mu,{\sigma}^2\right)$$ $$f\left(x\right)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{ {\left(x-\mu\right)}^2}{2{\sigma}^2} }$$ $$EX=\frac{2\sigma}{\sqrt{2\pi} }+\lvert \mu\rvert =\mu<+\infty$$
-
-
随机变量函数的数学期望
-
设
$$Y=g\left(X\right)$$ -
若
$$X$$ 为离散型随机变量,其分布律为$$P\left(X=x_k\right)=p_k,k=1,2,\cdots$$ ,则$$EY=\sum_\limits{k=1}^{\infty}{g\left(x_k\right)p_k}$$ -
若
$$X$$ 为连续型随机变量,其密度函数为$$f\left(x\right)$$ ,则$$EY=\int_{-\infty}^{+\infty}{g\left(x\right)f\left(x\right)\mathrm{d}x}$$
-
-
设
$$Z=g\left(X,Y\right)$$ -
若
$$\left(X,Y\right)$$ 为离散型随机变量,则$$EY=\sum_\limits{j=1}^{\infty}{\sum_\limits{i=1}^{\infty}{g\left(x_i,y_j\right)p_{ij} }}$$ -
若
$$\left(X,Y\right)$$ 为连续型随机变量,则$$EY=\int_{-\infty}^{+\infty}{\int_{-\infty}^{+\infty}{g\left(x,y\right)f\left(x,y\right)\mathrm{d}x}\mathrm{d}y}$$
-
-
-
数学期望的性质
-
$$EC=C$$ -
$$E\left(CX\right)=CEX$$ -
$$E\left(X+Y\right)=EX+EY$$ $$E\left(\sum_\limits{i=1}^{n}{X_i}\right)=\sum_\limits{i=1}^{n}{EX_i}$$ $$E\left(aX+b\right)=aEX+b$$ -
若
$$X,Y$$ 相互独立,则$$E\left(X\cdot Y\right)=EX\cdot EY$$
-
-
定义
$$DX=E{\left(X-EX\right)}^2=EX^2-{\left(EX\right)}^2$$ -
常见方差
-
$$\left(0,1\right)$$ 分布$$DX=pq$$ -
二项分布
$$B\left(n,p\right)$$ $$DX=np\left(1-p\right)$$ -
泊松分布
$$P\left(\lambda\right)$$ $$DX=\lambda$$ -
几何分布
$$G\left(p\right)$$ $$DX=\frac{q}{p^2}$$ -
均匀分布
$$U\left(a,b\right)$$ $$DX=\frac{ {\left(b-a\right)}^2}{12}$$ -
指数分布
$$e\left(\lambda\right)$$ $$DX=\frac{1}{ {\lambda}^2}$$ -
正态分布
$$N\left(\mu,{\sigma}^2\right)$$ $$DX={\sigma}^2$$
-
-
方差的性质
-
$$DC=0$$ -
$$D\left(aX+b\right)=a^2DX$$ -
若
$$X,Y$$ 相互独立,则$$D\left(aX\pm bY\right)=a^2DX+ b^2DY$$ -
标准化随机变量 $$X^{}=\frac{X-EX}{\sqrt{DX} },EX^{}=0,DX^{*}=1$$
-
$$DX\leq E{\left(X-C\right)}^2,C=EX$$ 时取等号 -
$$DX=0\Longleftrightarrow P\left(X=EX\right)=1$$
-
-
不等式
-
切比雪夫不等式
$$\forall \varepsilon>0,P\left(\lvert X-EX\rvert \geq\varepsilon\right)\leq\frac{DX}{ {\varepsilon}^2}$$ -
马尔可夫不等式
$$\forall \varepsilon>0,P\left(\lvert X\rvert \geq\varepsilon\right)\leq\frac{E{\lvert k\rvert }^k}{ {\varepsilon}^k}\left(k=1,2,\cdots\right)$$
-
-
定义
$$\mathrm{Cov}{\left(X,Y\right)}=E\left(X-EX\right)\left(Y-EY\right)=EXY-EXEY$$ 相关系数
$${\rho}_{XY}=\frac{\mathrm{Cov}{\left(X,Y\right)} }{\sqrt{DX\cdot DY} }$$ -
当
$${\rho}_{XY}=0$$ 时,称$$X,Y$$ 不相关 -
$$X,Y$$ 相互独立,则其一定不相关;但若$$X,Y$$ 不相关,却未必相互独立
-
-
协方差的性质
-
$$\mathrm{Cov}{\left(X,Y\right)}=\mathrm{cov}{\left(Y,X\right)}$$ -
$$\mathrm{Cov}{\left(X,X\right)}=DX$$ -
$$\mathrm{Cov}{\left(aX,bY\right)}=ab\mathrm{Cov}{\left(X,Y\right)}$$ -
$$\mathrm{Cov}{\left(X,C\right)}=0$$ -
$$\mathrm{Cov}{\left(\sum_\limits{i=1}^{n}{c_i x_i},Y\right)}=\sum_\limits{i=1}^{n}{c_i \mathrm{Cov}{\left(X_i,Y\right)} }$$
-
-
相关系数
-
$$\lvert {\rho}_{XY}\rvert \leq1$$ -
$$\lvert {\rho}_{XY}\rvert =1\Longleftrightarrow \exists a,b,a\neq 0,P\left(Y=aX+b\right)=1$$
-
-
矩
随机变量各种数学期望的集中称呼,反映了概率在随机变量空间上的分布。
-
$${\alpha}_k=EX^k$$ 是$$X$$ 的$$k$$ 阶原点矩 -
$${\beta}^k=E{\left(X-EX\right)}^k$$ 是$$X$$ 的$$k$$ 阶中心矩 -
$$EX^kY^l$$ 是$$X$$ 和$$Y$$ 的$$\left(k+l\right)$$ 阶混合原点矩 -
$${\gamma}_{kl}=E{\left(X-EX\right)}^k{\left(Y-EY\right)}^l$$ 是$$X$$ 和$$Y$$ 的$$\left(k+l\right)$$ 阶混合中心矩
数学期望
$$EX$$ 为$$X$$ 的$$1$$ 阶原点矩方差
$$DX$$ 为$$X$$ 的$$2$$ 阶中心矩协方差
$$\mathrm{Cov}\left(X,Y\right)$$ 为$$X$$ 和$$Y$$ 的$$\left(1+1\right)$$ 阶混合中心矩若高阶矩存在,则低阶矩一定存在,如方差存在则期望一定存在。
-
-
协方差矩阵
设
$$X=\left(X_1,X_2,\cdots,X_n\right)$$ 是$$n$$ 维随机向量,$$\mu=\left(\mu_1,\mu_2,\cdots,\mu_n\right),\mu_i=EX_i,i=1,2,\cdots,n$$ 称为$$X$$ 的期望向量$$\sigma_{ij}=E\left(X_i-\mu_i\right)\left(X_j-\mu_j\right)$$ 为$$X_i$$ 和$$X_j$$ 的协方差则称
$$n$$ 阶矩阵 $$\Sigma=\left[\begin{matrix}\sigma_{11}&\cdots&\sigma_{1n}\\vdots&&\vdots\\sigma_{n1}&\cdots&\sigma_{nn}\end{matrix}\right]$$ 为$$X$$ 的协方差矩阵-
$$\sigma_{ii}=DX_i$$ -
$$\sigma_{ij}=\sigma_{ji}$$ -
$$\forall t=\left(t_1,t_2,\cdots,t_n\right),t\sum{t^T}=\sum_\limits{i,j=1}^{n}{t_i\sigma_{ij}t_j\geq0}$$ -
$${\sigma}{ij}^{2}\leq \sigma{ii}\cdot\sigma_{jj}$$
-
-
$$n$$ 维正态分布$$n$$ 维随机向量$$X=\left(X_1,X_2,\cdots,X_n\right)$$ 的联合概率密度为$$f\left(x\right)=\frac{1}{ {\left(2\pi\right)}^{\frac{n}{2} }{\lvert \Sigma\rvert }^{\frac{1}{2} }}\exp{\left[-\frac{1}{2}\left(x-\mu\right)\Sigma^{-1}{\left(x-\mu\right)}^T\right]}$$ 其中
$$x=\left(x_1,x_2,\cdots,x_n\right),\mu=\left(\mu_1,\mu_2,\cdots,\mu_n\right),\Sigma={\left(\sigma_{ij}\right)}_{n\times n},\Sigma$$ 正定,
$$\lvert \Sigma\rvert $$ 是$$\Sigma$$ 的行列式,则称$$X$$ 服从$$n$$ 维正态分布,记为$$X\sim N\left(\mu_{1\times n},\Sigma_{n\times n}\right)$$ -
$$X\sim N\left(\mu_{1\times n},\Sigma_{n\times n}\right)\Longleftrightarrow \forall l=\left(l_1,l_2,\cdots,l_n\right), Xl^T\sim N\left(\mu l^T,\Sigma l^T\right)$$ -
$$C_{m\times n}$$ 为实矩阵,$$X\sim N\left(\mu_{1\times n},\Sigma_{n\times n}\right)\Longrightarrow Y=XC^T\sim N\left(\mu C^T,\Sigma C^T\right)$$ -
$$X_1,X_2,\cdots,X_n$$ 相互独立,$$X\sim N\left(\mu_{1\times n},\Sigma_{n\times n}\right)\Longleftrightarrow \Sigma$$ 为对角矩阵.
-
-
定义
-
设
$$\left{X_n\right}\left(n=1,2,\cdots \right)$$ 为一随机变量序列,$$X$$ 为随机变量,若对于$$\forall \varepsilon>0$$ ,有$$\lim_\limits{n\rightarrow \infty}{P\left{\lvert X_n-X\rvert \geq\varepsilon\right} }=0$$ ,则称序列$$\left{X_n\right}$$ 依概率收敛于$$X$$ ,记作$$\left{X_n\right}\xrightarrow{P}X$$ -
$$A_n=\left{\lvert X_n-X\rvert <\varepsilon\right},p_n=P\left(A_n\right)$$ ,则$$p_n\rightarrow 1 (n\rightarrow\infty)$$ 时,$$X_n$$ 以很大的可能性靠近$$X$$ ,其中$$\varepsilon$$ 为误差(随机性消失)
-
-
设
$$\left{X_n\right}\left(n=1,2,\cdots \right)$$ 为一随机变量序列,数学期望$$EX_n$$ 存在,记$$\overline{X_n}=\frac{1}{n}\sum_\limits{k=1}^{n}{X_k}$$ ,若$$\overline{X_n}\xrightarrow{P}E\overline{X_n}$$ ,则称序列$$\left{X_n\right}$$ 服从大数定律
-
-
切比雪夫大数定律
设
$$X_1,X_2,\cdots,X_n,\cdots$$ 为相互独立的随机变量所构成的序列,其中$$EX_k=\mu_k,DX_k\leq C<+\infty\left(k=1,2,\cdots,n,\cdots\right)$$ ,则$$\forall \varepsilon>0,$$ $$\lim_\limits{n\rightarrow \infty}{P\left(\lvert \frac{1}{n}\sum_\limits{k=1}^{n}{X_k}-\frac{1}{n}\sum_\limits{k=1}^{n}{\mu_k}\rvert \geq\varepsilon\right)}=0$$ - 相互独立,期望存在,方差有限,算术平均值依概率收敛到它本身的数学期望
-
辛钦大数定律
$$\left{X_n\right}$$ 独立同分布,$$EX_n=\mu\left(n=1,2,\cdots\right)$$ 存在,则$$\forall \varepsilon>0,$$ $$\lim_\limits{n\rightarrow \infty}{P\left(\lvert \frac{1}{n}\sum_\limits{k=1}^{n}{X_k}-\mu\rvert \geq\varepsilon\right)}=0$$- 切比雪夫大数定律加上同分布(注意这时方差不要求存在)
-
伯努利大数定律
设
$$n_A$$ 是$$n$$ 次独立重复试验中事件$$A$$ 发生的次数,$$p$$ 是事件$$A$$ 在每次试验中发生的概率,则$$\forall \varepsilon>0,$$ $$\lim_\limits{n\rightarrow \infty}{P\left(\lvert \frac{n_A}{n}-p\rvert \geq\varepsilon\right)}=0$$ -
辛钦大数定律加上同分布到
$$(0-1)$$ 分布 -
伯努利定律说明 , 事件
$$A$$ 发生的频率$$\frac{n_A}{n}$$ 以概率收敛到事件$$A$$ 发生的概率$$p$$ , 这就以严格的数学形式表达了频率的稳定性。 就是说 , 当$$n$$ 很大时 , 事件$$A$$ 发生的频率与概率有较大的差别的可能性很小 , 因而在实际中便可以用频率来代替概率 。
-
-
定义
相互独立的随机变量序列
$$\left{X_n\right}$$ ,设$$EX_n,DX_n\left(n=1,2,\cdots \right)$$ 存在,令$$Y_n=\frac{\sum_\limits{i=1}^{n}{EX_i}-\sum_\limits{i=1}^{n}{X_i} }{\sqrt{\sum_\limits{i=1}^{n}{DX_i} }}$$ ,若$$\lim_\limits{n\rightarrow \infty}{P\left{Y_n\leq x\right} }=\Phi\left(x\right)=\frac{1}{\sqrt{2\pi} }\int_{-\infty}^{x}{e^{-\frac{t^2}{2} }\mathrm{d}t}$$ 成立,则称$$\left{X_n\right}$$ 服从中心极限定理 -
林德贝格定理
设
$$\left{X_n\right}$$ 相互独立,数学期望和方差存在$$EX_k=\mu_k,DX_k=\sigma_{k}^2\left(k=1,2,\cdots,n,\cdots\right)$$ ,记$$B_n^2=\sum_\limits{k=1}^{n}{\sigma_{k}^2}$$ ,若$$\forall\varepsilon>0$$ ,有$$\lim_\limits{n\rightarrow \infty}{\frac{1}{B^2}\sum_\limits{k=1}^{n}{\int_{\lvert x-\mu_k\rvert \geq\varepsilon B_n}{ {\left(x-\mu_k\right)}^2\mathrm{d}{F_k\left(x\right)} }} }=0$$ ,则$$\left{X_n\right}$$ 服从中心极限定理-
相互独立,期望方差存在,满足林德贝格条件,序列和的标准化随机变量在$$n$$很大的时候满足标准正态分布
-
某随机变量由大量相互独立的随机因素的综合影响所成,且每一个别因素在总的影响中所起的作用都很小,这种变量往往近似地服从正态分布
-
记
$$B_n^2=\sum_\limits{k=1}^{n}{\sigma_{k}^2}$$ ,若$$\forall\varepsilon>0$$ ,有$$\lim_\limits{n\rightarrow \infty}{\frac{1}{B^2}\sum_\limits{k=1}^{n}{\int_{\lvert x-\mu_k\rvert \geq\varepsilon B_n}{ {\left(x-\mu_k\right)}^2\mathrm{d}{F_k\left(x\right)} }} }=0$$ 件就是对每一个子因素影响都很小的要求条件
-
-
独立同分布的中心极限定理
设$$\left{X_n\right}$$ 独立同分布,数学期望和方差存在
$$EX_k=\mu,DX_k=\sigma^2<+\infty\left(k=1,2,\cdots\right)$$ ,则$$\forall\varepsilon\in \mathbb{R}$$ ,$$\lim_\limits{n\rightarrow \infty}{P\left(\frac{\sum_\limits{k=1}^{n}{X_k}-n\mu}{\sqrt{n}\sigma}\leq x\right)}=\Phi\left(x\right)$$ - 林德贝格定理加上同分布
-
德莫佛-拉普拉斯定理
设随机变量
$$\mu_n$$ 服从二项分布$$B\left(n,p\right)$$ ,对于$$\forall x$$ ,有$$\lim_\limits{n\rightarrow \infty}{P\left(\frac{\mu_n-np}{\sqrt{np\left(1-p\right)}\sigma}\leq x\right)}=\Phi\left(x\right)$$ -
应用
令
$$\mu_n$$ 是$$n$$ 重伯努利试验中事件$$A$$ 发生的次数,则$$\mu_n\sim B\left(n,p\right)$$ ,其中$$p=P\left(A\right)$$ $$P\left(\lvert \frac{\mu_n}{n}-p\rvert <\varepsilon\right)=2\Phi\left(\varepsilon\sqrt{\frac{n}{pq} }\right)-1$$ -
若
$$\eta_n\sim B\left(n,p\right)$$ ,则当$$n\rightarrow \infty$$ ,$$p$$ 不是很小(如$$0.5$$ )时,$$\eta_n$$ 近似服从正态分布$$N\left(np,np\left(1-p\right)\right)$$ ;$$p$$ 很小时用$$\lambda=np$$ 的泊松分布更精确
-
-
总体
我们把所研究的全部元素组成的集合称作母体或总体 , 总体中的每一个元素称为个体
我们只研究感兴趣的某个或者几个指标(记为
$$X$$ ),因此把这些指标的分布称为总体的分布,记为$$X\sim F\left(x\right)$$ -
个体
设总体
$$X$$ 具有分布函数$$F\left(x\right)$$ ,若$$X_1,X_2,\cdots,X_n$$ 是具有分布函数$$F\left(x\right)$$ 的相互独立的随机向量,则称其为总体$$F$$ (或总体$$X$$ )的简单随机样本 ,简称样本 , 它们的观察值$$x_1,x_2,\cdots,x_n$$ 称为样本观察值 , 又称为$$X$$ 的$$n$$ 个独立的观察值 -
统计量
设
$$X_1,X_2,\cdots,X_n$$ 是来自总体$$X$$ 的一个样本 ,$$g\left(X_1,X_2,\cdots,X_n\right)$$ 是一个与总体分布中未知参数无关的样本的连续函数,则称$$g\left(X_1,X_2,\cdots,X_n\right)$$ 为统计量统计量是样本的函数,它是一个随机变量,如果
$$x_1,x_2,\cdots,x_n$$ 是样本观察值 , 则$$g\left(x_1,x_2,\cdots,x_n\right)$$ 是统计量$$g\left(X_1,X_2,\cdots,X_n\right)$$ 的一个观察值-
常用统计量
-
样本均值
$$\overline{X}=\frac{1}{n}\sum_\limits{i=1}^{n}{X_i}$$ -
样本方差
$$S^2=\frac{1}{n-1}\sum_{i=1}^{n}{ {\left(X_i-\overline{X}\right)}^2}$$ -
样本
$$k$$ 阶原点矩$$A_k=\frac{1}{n}\sum_\limits{i=1}^{n}{X_i^k},k=1,2,\cdots$$ -
样本
$$k$$ 阶中心矩$$B_k=\frac{1}{n}\sum_\limits{i=1}^{n}{ {\left(X_i-\overline{X}\right)}^k},k=2,3,\cdots$$ -
当样本容量很大时,$$B_2\approx S^2$$
-
总体
$$X$$ 的$$k$$ 阶矩存在,则当$$n$$ 很大时,$$A_k$$ 依概率收敛到$$a_k$$ -
样本的联合分布
-
若
$$X\sim F\left(x\right)$$ ,$$X_1,X_2,\cdots,X_n$$ 为$$F$$ 的一个样本,则$$X_1,X_2,\cdots,X_n$$ 的联合分布函数为$$F^{*}\left(x_1,x_2,\cdots,x_n\right)=\prod_\limits{i=1}^{n}{F\left(x_i\right)}$$ -
若总体
$$X$$ 是离散型随机变量,其分布律为$$p_x=P\left(X=x\right),x=x_1,x_2,\cdots$$ ,则$$X_1,X_2,\cdots,X_n$$ 的联合分布函数为$$P\left(X_1=y_1,\cdots,X_n=y_n\right)=\prod_\limits{i=1}^{n}{F\left(X_i=y_i\right)}$$ ,其中$$y_i=x_1,x_2,\cdots$$ -
若
$$X$$ 具有概率密度$$f\left(x\right)$$ ,则$$X_1,X_2,\cdots,X_n$$ 的联合分布函数为$$f^{*}\left(x_1,x_2,\cdots,x_n\right)=\prod_\limits{i=1}^{n}{F\left(x_i\right)}$$
-
-
设
$$X_1,\cdots,X_n$$ 是总体$$X$$ 的样本,$$EX=\mu,DX={\sigma}^2$$ 存在,$$\left{ \begin{array}{lr} E\overline{X}=\mu\ D\overline{X}=\frac{ {\sigma}^2}{n} \end{array} \right.\left{ \begin{array}{lr} ES^2={\sigma}^2\ DS^2=\frac{2{\sigma}^4}{n-1} \end{array} \right.$$
$$\overline{X}\xrightarrow{P}\mu,S^2\xrightarrow{P}{\sigma}^2$$
-
-
-
统计量
-
$$\chi^2$$ -分布-
定义
设
$$X_1,X_2,\cdots,X_n$$ 来自总体$$N\left(0,1\right)$$ 的样本,则称统计量$$\chi^2=X_1^2+X_2^2+\cdots+X_n^2$$ 服从自由度为$$n$$ 的$$\chi^2$$ 分布,记作$$\chi^2\sim\chi^2\left(n\right)$$ -
$$\chi^2\left(n\right)$$ 概率密度为 $$f\left(y\right)=\left{ \begin{array}{lr} \frac{1}{2^{\frac{n}{2} }\Gamma\left(\frac{n}{2}\right)}y^{\frac{n}{2}-1}e^{-\frac{y}{2} } &y>0\ 0 &y\leq0 \end{array} \right.$$ -
$$\Gamma$$ 分布和$$\chi^2\left(n\right)$$ 分布关系$$\chi^2=\sum_\limits{i=1}^{n}{X_i^2}\sim\Gamma\left(\frac{n}{2},\frac{1}{2}\right)$$ -
性质
-
若
$$\chi_1^2\sim\chi^2\left(m\right),\chi_2^2\sim\chi^2\left(n\right)$$ ,且$$\chi_1^2,\chi_2^2$$ 独立,有$$\chi_1^2+\chi_2^2\sim \chi^2\left(m+n\right)$$ -
若
$$\chi^2\sim\chi^2\left(n\right)$$ ,则$$E\left(\chi^2\right)=n,D\left(\chi^2\right)=2n$$
-
-
$$\chi^2$$ 分布的上$$\alpha$$ 分位点对于给定整数
$$\alpha,0<\alpha<1,P\left(\chi^2>\chi_{\alpha}^{2}{\left(n\right)}\right)=\int_{\chi_{\alpha}^{2}{\left(n\right)} }^{+\infty}{f\left(y\right)\mathrm{d}y}=\alpha$$ 的点$$\chi_{\alpha}^{2}{\left(n\right)}$$ 为$$\chi^2\left(n\right)$$ 分布的上$$\alpha$$ 分位点
-
-
$$t$$ -分布-
定义
设
$$X\sim N\left(0,1\right),Y\sim\chi^2\left(n\right)$$ ,且$$X,Y$$ 相互独立,则称$$T=\frac{X}{\sqrt{\frac{Y}{n} }}$$ 服从自由度为$$n$$ 的$$t$$ -分布,记作$$T\sim t\left(n\right)$$ -
$$t\left(n\right)$$ 概率密度为$$f\left(t\right)=\frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{\pi n}\Gamma\left(\frac{n}{2}\right)}{\left(1+\frac{t^2}{n}\right)}^{-\frac{n+1}{2} },-\infty<t<+\infty$$ -
$$\lim_\limits{n\rightarrow \infty}{f\left(t\right)}=\frac{1}{\sqrt{2\pi} }e^{-\frac{t^2}{2} }$$ ,即当$$n$$ 充分大时,$$t$$-分布近似$$N\left(0,1\right)$$ 分布
-
-
$$t$$ -分布的上$$\alpha$$ 分位点对于给定整数
$$\alpha,0<\alpha<1,P\left(t>t_{\alpha}{\left(n\right)}\right)=\int_{t_{\alpha}{\left(n\right)} }^{+\infty}{f\left(t\right)\mathrm{d}t}=\alpha$$ 的点$$t_{\alpha}{\left(n\right)}$$ 为$$t\left(n\right)$$ 分布的上$$\alpha$$ 分位点-
$$t_{1-\alpha}{\left(n\right)}=-t_{\alpha}{\left(n\right)}$$ .
-
-
-
$$F$$ -分布-
定义
设
$$U\sim \chi^2\left(m\right),V\sim\chi^2\left(n\right)$$ ,且$$U,V$$ 相互独立,则称$$F=\frac{\frac{U}{m} }{\frac{V}{n} }$$ 服从自由度为$$\left(m,n\right)$$ 的$$F$$ -分布,记作$$F\sim F\left(m,n\right)$$ -
$$F$$ 分布的概率密度为 $$\psi\left(y\right)=\left{ \begin{array}{lr} \frac{\Gamma\left(\frac{m+n}{2}\right){\left(\frac{m}{n}\right)}^{\frac{m}{2} }y^{\frac{m}{2}-1} }{\Gamma\left(\frac{m}{2}\right)\Gamma\left(\frac{n}{2}\right){\left(1+\frac{m}{n}y\right)}^{\frac{m+n}{2} }} &y>0\ 0 &y\leq0 \end{array} \right.$$ -
性质
- 若
$$F\sim F\left(m,n\right)$$ ,则$$\frac{1}{F}\sim F\left(n,m\right)$$
- 若
-
$$F$$ -分布的上$$\alpha$$ 分位点对于给定整数
$$\alpha,0<\alpha<1,P\left(F>F_{\alpha}{\left(m,n\right)}\right)=\alpha$$ 的点$$F_{\alpha}{\left(m,n\right)}$$ 为$$F$$ -分布的上$$\alpha$$ 分位点-
$$F_{1-\alpha}{\left(m,n\right)}=\frac{1}{F_{\alpha}{\left(n,m\right)} }$$ .
-
-
-
单个正态总体
设
$$\left(X_1,\cdots,X_n\right)$$ 为来自总体$$N\left(\mu,{\sigma}^2\right)$$ 的一组容量为$$n$$ 的样本,令$$\overline{X}=\frac{1}{n}\sum_\limits{i=1}^{n}{X_i},S^2=\frac{1}{n-1}\sum_{i=1}^{n}{ {\left(X_i-\overline{X}\right)}^2}$$ ,则-
$$U=\frac{\overline{X}-\mu}{\sigma}\sqrt{n}\sim N\left(0,1\right)$$ -
$$\overline{X}$$ 与$$S^2$$ 相互独立 -
$$\frac{\left(n-1\right)S^2}{ {\sigma}^2}=\sum_\limits{i=1}^{n}{ {\left(\frac{X_i-\overline{X} }{\sigma}\right)}^2}\sim \chi^2\left(n-1\right)$$ -
$$T=\frac{\overline{X}-\mu}{S}\sqrt{n}\sim t\left(n-1\right)$$
-
-
两个正态总体
设
$$\left(X_1,\cdots,X_m\right)$$ 为来自总体 $$X\sim N\left(\mu_1,{\sigma}1^2\right)$$ 的一组容量为 $$m$$ 的样本,$$\left(Y_1,\cdots,Y_n\right)$$ 为来自总体 $$Y\sim N\left(\mu_2,{\sigma}2^2\right)$$ 的一组容量为 $$n$$ 的样本,两组样本相互独立,令 $$\overline{X}=\frac{1}{m}\sum\limits{i=1}^{m}{X_i},S{1m}^2=\frac{1}{m-1}\sum_{i=1}^{m}{ {\left(X_i-\overline{X}\right)}^2},\overline{Y}=\frac{1}{n}\sum_\limits{i=1}^{n}{Y_i},S_{2n}^2=\frac{1}{n-1}\sum_{i=1}^{n}{ {\left(Y_i-\overline{Y}\right)}^2}$$,则-
$$\frac{\left(\overline{X}-\overline{Y}\right)-\left(\mu_1-\mu_2\right)}{\sqrt{\frac{ {\sigma}_1^2}{m}+\frac{ {\sigma}_2^2}{n} }}\sim N\left(0,1\right)$$ ; -
$$\frac{\left(m-1\right)S_{1m}^2}{ {\sigma}1^2}+\frac{\left(n-1\right)S{2n}^2}{ {\sigma}_2^2}\sim\chi^2\left(m+n-2\right)$$;
-
$$\frac{\frac{\left(\overline{X}-\overline{Y}\right)-\left(\mu_1-\mu_2\right)}{\sqrt{\frac{ {\sigma}_1^2}{m}+\frac{ {\sigma}2^2}{n} }} }{\sqrt{\frac{\frac{\left(m-1\right)S{1m}^2}{ {\sigma}1^2}+\frac{\left(n-1\right)S{2n}^2}{ {\sigma}_2^2} }{m+n-2} }}\sim t\left(m+n-2\right)$$,
$$\frac{\left(\overline{X}-\overline{Y}\right)-\left(\mu_1-\mu_2\right)}{\sqrt{\frac{\left(m-1\right)S_{1m}^2+\left(n-1\right)S_{2n}^2}{m+n-2} }\sqrt{\frac{1}{m}+\frac{1}{n} }}\sim t\left(m+n-2\right),\sigma_1=\sigma_2$$ ; -
$$\frac{S_{1m}^2}{S_{2n}^2}\frac{\sigma_2^2}{\sigma_1^2}\sim F\left(m-1,n-1\right)$$ .
-
-
问题的提法
设总体
$$X$$ 的分布函数$$F\left(x;\theta\right)$$ 的形式为已知,$$\theta$$ 为待估参数,$$X_1,X_2,\cdots,X_n$$ 为$$X$$ 的一个样本,$$x_!,x_2,\cdots,x_n$$ 为相应的一个样本值点估计问题及为构造一个统计量
$$\hat{\theta}\left(X_1,X_2,\cdots,X_n\right)$$ ,用它的观察值$$\hat{\theta}\left(x_1,x_2,\cdots,x_n\right)$$ 来估计未知参数$$\theta$$ ,称$$\hat{\theta}\left(X_1,X_2,\cdots,X_n\right)$$ 为$$\theta$$ 的估计量,$$\hat{\theta}\left(x_1,x_2,\cdots,x_n\right)$$ 为$$\theta$$ 的估计值 -
矩估计法
设总体
$$X$$ 的分布函数为$$F\left(x;\theta_1,\theta_2,\cdots,\theta_k\right)$$ ,称 $$\left{\begin{array}{lr} \alpha_r\left(\theta_1,\theta_2,\cdots,\theta_k\right)=EX^r=A_r=\frac{1}{n}\sum_\limits{i=1}^{n}{X_i^r}\ r=1,2,\cdots,k \end{array} \right.$$ 的解$$\hat{\theta}\left(X_1,X_2,\cdots,X_n\right)$$ 为$$\hat{\theta}\left(x_1,x_2,\cdots,x_n\right)$$ 的矩估计量- 样本原点矩依概率收敛于相应的总体原点矩, 而样本矩的连续函数依概率收敛于相应的总体矩的连续函数,所以所有的矩估计都有依概率收敛这一性质(相合性)
-
极大似然估计法
总体
$$X\sim f\left(x;\theta_1,\theta_2,\cdots,\theta_k\right)$$ ,$$L\left(\theta_1,\theta_2,\cdots,\theta_k\right)=\prod_\limits{i=1}^{n}{f\left(x;\theta_1,\theta_2,\cdots,\theta_k\right)}$$ 称为参数$$\left(\theta_1,\theta_2,\cdots,\theta_k\right)$$ 的似然函数-
若似然函数
$$L\left(\theta_1,\theta_2,\cdots,\theta_k\right)$$ 在$$\hat{\theta_i}\left(x_1,x_2,\cdots,x_n\right)$$ 处取最大值,则称$$\hat{\theta_i}$$ 为$$\theta_i$$ 的极大似然估计值,$$\hat{\theta_i}\left(X_1,X_2,\cdots,X_n\right)$$ 为参数$$\theta_i$$ 的极大似然估计量 -
求解方法:
-
求解对数似然方程
$$\frac{\partial\ln{L\left(\theta_1,\theta_2,\cdots,\theta_k\right)} }{\partial\theta_i}=0\left(i=1,2,\cdots,k\right)$$ ,若驻点唯一,即为极大似然估计 -
根据定义计算
-
-
设
$$\theta$$ 的函数$$u=u\left(\theta\right),\theta\in\Theta$$ 具有单值反函数$$\theta=\theta\left(u\right),u\in\mu$$ ,且$$\hat{\theta}$$ 是参数$$\theta$$ 的极大似然估计,则$$\hat{u}=u\left(\hat{\theta}\right)$$ 是$$u\left(\theta\right)$$ 的极大似然估计
-
-
无偏性
若估计量
$$\hat{\theta}=\hat{\theta}\left(X_1,X_2,\cdots,X_n\right)$$ 的数学期望$$E\left(\hat{\theta}\right)$$ 存在,且$$\forall\theta\in\Theta,E\left(\hat{\theta}\right)=\theta$$ ,则称$$\hat{\theta}$$ 为$$\theta$$ 的无偏估计量若
$$\lim_\limits{n\rightarrow\infty}{E\hat{\theta} }=\theta$$ ,则称$$\hat{\theta}$$ 为$$\theta$$ 的渐近无偏估计 -
有效性
若
$$E\hat{\theta}_1=E\hat{\theta}_2=\theta$$ ,若有$$D\left(\hat{\theta}_1\right)\leq D\left(\hat{\theta}_2\right)$$ ,则称$$\hat{\theta}_1$$ 比$$\hat{\theta}_2$$ 有效所有无偏估计中方差最小的无偏估计称为最小方差无偏估计,或称为有效估计
- 总体
$$X\sim f\left(x;\theta\right)$$ ,若$$E\hat{\theta}=\theta$$ ,则$$D\left(\hat{\theta}\right)\geq \frac{1}{nI\left(\theta\right)}$$ (G-R下界),其中Fisher信息数$$I\left(\theta\right)=E{\left[\frac{\partial}{\partial\theta}\ln{f\left(X,\theta\right)}\right]}^2$$
若
$$D\left(\hat{\theta}\right)=\frac{1}{nI\left(\theta\right)}$$ ,则称$$\hat{\theta}$$ 为$$\theta$$ 的有效估计若
$$\lim_\limits{n\rightarrow\infty}\frac{\frac{1}{nI\left(\theta\right)} }{D\left(\hat{\theta}\right)}=1$$ ,则称$$\hat{\theta}$$ 为$$\theta$$ 的渐近有效估计 - 总体
-
相合性(一致估计)
若
$$\hat{\theta}\left(X_1,X_2,\cdots,X_n\right)\stackrel{P}{\longrightarrow}\theta$$ ,即$$\forall\varepsilon>0,\lim_\limits{n\rightarrow\infty}{P\left(\lvert \hat{\theta}-\theta\rvert \geq\varepsilon\right)}=0$$ ,则称$$\hat{\theta}$$ 为$$\theta$$ 的相合估计量- 所有的矩估计都是相合估计
若
$$\lim_\limits{n\rightarrow\infty}{D\hat{\theta} }=0,\lim_\limits{n\rightarrow\infty}{b\left(\theta\right)}=\lim_\limits{n\rightarrow\infty}{\left(E\hat{\theta}-\theta\right)}=0$$ ,则$$\hat{\theta}$$ 为$$\theta$$ 的相合估计量$$D\overline{X}=\frac{1}{n}DX$$
-
定义
设总体
$$X\sim f\left(x;\theta\right)$$ ,其中$$\theta$$ 未知,若对于给定的$$0<\alpha<1$$ ,统计量$$\hat{\theta}_1=\hat{\theta}_1\left(X_1,\cdots,X_n\right)$$ 和$$\hat{\theta}_2=\hat{\theta}_2\left(X_1,\cdots,X_n\right)$$ 满足$$P\left(\hat{\theta}_1<\theta<\hat{\theta}_2\right)=1-\alpha$$ ,则称随即区间$$\left(\hat{\theta}_1,\hat{\theta}_2\right)$$ 是$$\theta$$ 的置信度为$$1-\alpha$$ 的置信区间,$$\hat{\theta}_1$$ 和$$\hat{\theta}_2$$ 分别称为置信度为$$1-\alpha$$ 的置信上限和置信下限,$$1-\alpha$$ 称为置信度或置信水平- 置信区间不唯一
- 置信区间长度越短,估计越精确,所以一般我们是对称的取,此时的置信区间长度最短
-
求置信区间(枢轴量法)
-
设法构造一个随机变量
$$Z=Z\left(X_1,X_2,\cdots,X_n;\theta\right)$$ ,除参数外,$$Z$$ 不包含其他任何未知参数,$$Z$$ 的分布已知或可求出,并且不依赖于参数$$q$$ ,也不依赖于其他任何未知参数($$Z$$ 即称为枢轴量) -
对于给定的置信度
$$1-\alpha$$ ,求出$$a,b$$ ,使得$$P\left{a<Z\left(X_1,\cdots,X_n;\theta\right)<b\right}=1-\alpha$$ -
由不等式
$$a<Z\left(X_1,\cdots,X_n;\theta\right)<b$$ 解得$$\hat{\theta}_1\left(X_1,\cdots,X_n\right)<\theta<\hat{\theta}_2\left(X_1,\cdots,X_n\right)$$ ,即$$P\left(\hat{\theta}_1<\theta<\hat{\theta}_2\right)=1-\alpha$$
-
-
单个正态总体参数的区间估计
总体
$$X\sim N\left(\mu,{\sigma}^2\right)$$ 被估参数 条件 选用统计量 分布 $$1-\alpha$$ 的置信区间$$\mu$$ $${\sigma}^2$$ 已知$$U=\frac{\overline{X}-\mu}{\sigma}\sqrt{n}$$ $$N\left(0,1\right)$$ $$\left[\overline{X}-\frac{\sigma}{\sqrt{n} }u_{\frac{\alpha}{2} },\overline{X}+\frac{\sigma}{\sqrt{n} }u_{\frac{\alpha}{2} }\right]$$ $$\mu$$ $${\sigma}^2$$ 未知$$T=\frac{\overline{X}-\mu}{\frac{S}{\sqrt{n} }}$$ $$t\left(n-1\right)$$ $$\left[\overline{X}-\frac{S}{\sqrt{n} }t_{\frac{\alpha}{2} },\overline{X}+\frac{S}{\sqrt{n} }t_{\frac{\alpha}{2} }\right]$$ $${\sigma}^2$$ $$\mu$$ 未知$${\chi}^2=\frac{\left(n-1\right)S^2}{ {\sigma}^2}$$ $${\chi}^2\left(n-1\right)$$ $$\left[\frac{\left(n-1\right)S^2}{ {\chi}^2_{\frac{\alpha}{2} }\left(n-1\right)},\frac{\left(n-1\right)S^2}{ {\chi}^2_{1-\frac{\alpha}{2} }\left(n-1\right)}\right]$$ -
若
$$g\left(x\right)$$ 单调增,则$$P\left(\hat{\theta}_1<\theta<\hat{\theta}_2\right)=1-\alpha\Longrightarrow P\left(g\left(\hat{\theta}_1\right)<g\left(\theta\right)<g\left(\hat{\theta}_2\right)\right)=1-\alpha$$ 若
$$g\left(x\right)$$ 单调减,则$$P\left(\hat{\theta}_1<\theta<\hat{\theta}_2\right)=1-\alpha\Longrightarrow P\left(g\left(\hat{\theta}_2\right)<g\left(\theta\right)<g\left(\hat{\theta}_1\right)\right)=1-\alpha$$
-
-
两个正态总体的区间估计
参数 | 条件 |
|
---|---|---|
|
||
|
||
|
-
基本思想
-
假设某个结论成立
-
小概率事件在一次抽样过程中发生了/一次抽样中没有发生小概率事件
-
认为原假设不成立/接受原假设
-
-
一般步骤
-
根据实际问题提出原假设
$$H_0$$ 及备择假设$$H_1$$ -
选择适当统计量,在
$$H_0$$ 条件下决定统计量分布 -
对给定的显著性水平
$$0<\alpha<1$$ ,根据$$P\left(\left(X_1,X_2,\cdots,X_n\right)\in S\mid H_0\right)=\alpha$$ 确定拒绝域$$S$$ -
一旦得到一组样本观察值
$$\left(x_1,x_2,\cdots,x_n\right)$$ ,若$$\left(x_1,x_2,\cdots,x_n\right)\in S$$ ,则拒绝$$H_0$$ ,否则接受$$H_0$$
-
-
假设检验的两类错误
-
第一类错误:如果原假设$$H_0$$成立,而观察值落入拒绝域,从而作出拒绝$$H_0$$的结论,称作第一类错误,又称弃真的错误。由定义知,显著性水平
$$\alpha$$ 恰好是犯第一类错误的概率 -
第二类错误:如果原假设$$H_0$$不成立 , 而观察值却落入接受域,从而作出接受
$$H_0$$ 的结论,称作第二类错误,又称取伪的错误,通常记作$$\beta$$ 。
一般按照控制犯第一类错误的原则进行检验而不考虑犯第二类错误(保护原假设的原则),这种检验问题 称为显著性检验问题
-
总体
-
$$\sigma^2$$ 已知,检验$$\mu$$ -
$$H_0:\mu=\mu_0,H_1:\mu\neq\mu_0$$ ,双边检验-
假设
$$H_0$$ 成立 -
当
$$\mu=\mu_0$$ 时,统计量$$U=\frac{\overline{X}-\mu}{\sigma}\sqrt{n}\sim N\left(0,1\right)$$ 分布已知 -
$$P\left(\lvert \frac{\overline{X}-\mu}{\sigma}\sqrt{n}\rvert \geq k\mid H_0\right)\leq \alpha$$ ,满足该不等式则为$$H_0$$ 的拒绝域 -
令
$$k=u_{\frac{\alpha}{2} }$$ ,最大允许拒绝域为$$S=\left{\left(x_1,\cdots,x_n\right)\mid \lvert \frac{\overline{X}-\mu_0}{\sigma}\sqrt{n}\rvert \geq u_{\frac{\alpha}{2} }\right}$$
-
-
$$H_0:\mu\leq\mu_0,H_1:\mu>\mu_0$$ ,单边右检验-
假设
$$H_0$$ 成立 -
当
$$\mu\leq\mu_0$$ 时,统计量$$U=\frac{\overline{X}-\mu}{\sigma}\sqrt{n}\sim N\left(\frac{\mu-\mu_0}{\sigma}\sqrt{n},1\right)$$ 分布已知 -
$$P\left(\frac{\overline{X}-\mu_0}{\sigma}\sqrt{n}\geq k\mid H_0\right)=P\left(\frac{\overline{X}-\mu}{\sigma}\sqrt{n}\geq k-\frac{\mu-\mu_0}{\sigma}\sqrt{n}\mid H_0\right)\leq P\left(\frac{\overline{X}-\mu}{\sigma}\sqrt{n}\geq k\mid H_0\right)\leq \alpha$$ ,满足该不等式则为$$H_0$$ 的拒绝域 -
令
$$k=u_{\alpha}$$ ,最大允许拒绝域为$$S=\left{\left(x_1,\cdots,x_n\right)\mid \lvert \frac{\overline{X}-\mu_0}{\sigma}\sqrt{n}\rvert \geq u_{\alpha}\right}$$
-
$$H_0$$ $$H_0$$ 真时统计量的分布$$\mu=\mu_0$$ $$U=\frac{\overline{X}-\mu_0}{\sigma}\sqrt{n}\sim N\left(0,1\right)$$ $$H_1$$ 拒绝 $$H_0$$ 的区域$$\mu\neq\mu_0$$ $$\lvert U\rvert \geq u_{\frac{\alpha}{2} }$$ $$\mu>\mu_0$$ $$U\geq u_{\alpha}$$ $$\mu<\mu_0$$ $$U\leq-u_{\alpha}$$ -
-
$$\sigma^2$$ 未知,检验$$\mu$$ $$H_0$$ $$H_0$$ 真时统计量的分布$$\mu=\mu_0$$ $$T=\frac{\overline{X}-\mu_0}{S}\sqrt{n}\sim t\left(n-1\right)$$ $$H_1$$ 拒绝 $$H_0$$ 的区域$$\mu\neq\mu_0$$ $$\lvert T\rvert \geq t_{\frac{\alpha}{2} }\left(n-1\right)$$ $$\mu>\mu_0$$ $$T\geq t_{\alpha}\left(n-1\right)$$ $$\mu<\mu_0$$ $$T\leq-t_{\alpha}\left(n-1\right)$$ -
$$\mu$$ 已知,检验$$\sigma^2$$ $$H_0$$ $$H_0$$ 真时统计量的分布$$\sigma^2=\sigma_0^2$$ $$\chi^2=\frac{1}{\sigma_0^2}\sum_\limits{i-1}^{n}{ {\left(X_i-\mu\right)}^2}\sim \chi^2\left(n\right)$$ $$H_1$$ 拒绝 $$H_0$$ 的区域$$\sigma^2=\sigma_0^2$$ $$\chi^2\leq\chi_{1-\frac{\alpha}{2} }^2,\chi^2\geq\chi_{\frac{\alpha}{2} }^2$$ $$\sigma^2>\sigma_0^2$$ $$\chi^2\geq\chi_{\alpha}^2\left(n\right)$$ $$\sigma^2<\sigma_0^2$$ $$\chi^2\leq\chi_{1-\alpha}^2\left(n\right)$$ -
$$\mu$$ 未知,检验$$\sigma^2$$ $$H_0$$ $$H_0$$ 真时统计量的分布$$\sigma^2=\sigma_0^2$$ $$\chi^2=\frac{\left(n-1\right)S^2}{\sigma_0^2}=\sum_\limits{i-1}^{n}{ {\left(\frac{X_i-\overline{X} }{\sigma_0}\right)}^2}\sim \chi^2\left(n-1\right)$$ $$H_1$$ 拒绝 $$H_0$$ 的区域$$\sigma^2=\sigma_0^2$$ $$\chi^2\leq\chi_{1-\frac{\alpha}{2} }^2,\chi^2\geq\chi_{\frac{\alpha}{2} }^2$$ $$\sigma^2>\sigma_0^2$$ $$\chi^2\geq\chi_{\alpha}^2\left(n-1\right)$$ $$\sigma^2<\sigma_0^2$$ $$\chi^2\leq\chi_{1-\alpha}^2\left(n-1\right)$$