概率论与数理统计 公式指数分布 f(x)ex, 0, x0, x0, 其中0,则称随机变量X服从参数为的指数分布。 X的分布函数为 x1e,x0, F(x) 0, x<0。 记住积分公式: x0nexdxn! 正态分布 设随机变量X的密度函数为 20为常数,其中、则称随机变量X服从参数为、f(x)1(x)222e, x, 的正态分布或高斯(Gauss)分布,记为X~N(,)。 f(x)具有如下性质: 21° f(x)的图形是关于x对称的; 2° 当x时,f()1222(t)X~N(,)X的分布函数为 若x,则122F(x)edt2。。 为最大值; 参数0、1时的正态分布称为标准正态分布,记为2X~N(0,1),其密度函数记为x 12(x)e2,x, 分布函数为 (x)1xt22(x)是不可求积函数,其函数值,已编制成表可供查用。 e2dt。 Φ(-x)=1-Φ(x)且Φ(0)=如果X~N(,),则212X。 ~N(0,1)。 x2x1P(x1Xx2)。 7
概率论与数理统计 公式
(6)分位数 (7)函数分布 下分位表:P(X)=; 上分位表:P(X)=。 离散型 已知X的分布列为 Xx1,x2,,xn,P(Xxi)p1,p2,,pn,, Yg(X)的分布列(yig(xi)互不相等)如下: YP(Yyi)g(x1),g(x2),,g(xn),, p1,p2,,pn,若有某些g(xi)相等,则应将对应的pi相加作为g(xi)的概率。 连续型 先利用X的概率密度fX(x)写出Y的分布函数FY(y)=P(g(X)≤y),再利用变上下限积分的求导公式求出fY(y)。 第三章 二维随机变量及其分布
(1)联合分布 离散型 如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y),则称为离散型随机量。 设=(X,Y)的所有可能取值为(xi,yj)(i,j1,2,),且事件{=(xi,yj)}的概率为pij,,称 P{(X,Y)(xi,yj)}pij(i,j1,2,) 为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示: Y X y1 p11 p21 y2 p12 p22 „ „ „ „ yj p1j p2j pij „ „ „ x1 x2 xi pi1 „ 这里pij具有下面两个性质: (1)pij≥0(i,j=1,2,„); (2)ijpij1. 8
概率论与数理统计 公式
连续型 对于二维随机向量(X,Y),如果存在非负函数f(x,y)(x,y),使对任意一个其邻边分别平行于坐标轴的矩形区域D,即D={(X,Y)|ax1时,有F(x2,y)≥F(x1,y);当y2>y1时,有F(x,y2) ≥F(x,y1); (3)F(x,y)分别对x和y是右连续的,即 F(x,y)F(x0,y),F(x,y)F(x,y0); (4)F(,)F(,y)F(x,)0,F(,)1. (5)对于x1x2,y1y2, F(x2,y2)F(x2,y1)F(x1,y2)F(x1,y1)0. (4)离散型与连续型的关系 P(Xx,Yy)P(xXxdx,yYydy)f(x,y)dxdy 9概率论与数理统计 公式
(5)边缘分布 离散型 X的边缘分布为 PiP(Xxi)jpij(i,j1,2,); Y的边缘分布为 PjP(Yyj)ipij(i,j1,2,)。 连续型 X的边缘分布密度为 fX(x)f(x,y)dy; Y的边缘分布密度为 fY(y)f(x,y)dx. (6)条件分布 离散型 在已知X=xi的条件下,Y取值的条件分布为 P(Yy|Xxi)pijpi; j在已知Y=yj的条件下,X取值的条件分布为 P(Xxi|Yyj)pijpj, 连续型 在已知Y=y的条件下,X的条件分布密度为 f(x|y)f(x,y)fY(y); 在已知X=x的条件下,Y的条件分布密度为 f(y|x)f(x,y)fX(x) (7)独立性 一般型 离散型 F(X,Y)=FX(x)FY(y) pijpipj 有零不独立 连续型 f(x,y)=fX(x)fY(y) 直接判断,充要条件: ①可分离变量 ②正概率密度区间为矩形 f(x,y)2112二维正态分布 12(12e12x1)12(x1)(y2)y212222, =0 随机变量的函数 若X1,X2,„Xm,Xm+1,„Xn相互独立, h,g为连续函数,则: h(X1,X2,„Xm)和g(Xm+1,„Xn)相互独立。 特例:若X与Y独立,则:h(X)和g(Y)独立。 例如:若X与Y独立,则:3X+1和5Y-2独立。 10
概率论与数理统计 公式
(8)二维均匀分布 设随机向量(X,Y)的分布密度函数为 1SDf(x,y)0,(x,y)D 其他其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)~U(D)。 例如图3.1、图3.2和图3.3。 y 1 D1 O 1 图3.1 x y 1 O 图3.2 1 D2 2 x y d D3 c O a b x 图3.3 11
概率论与数理统计 公式
(9)二维正态分布 设随机向量(X,Y)的分布密度函数为 121212(12f(x,y)e12x1)12(x1)(y2)y212222, 其中1,2,10,布, 20,||1是5个参数,则称(X,Y)服从二维正态分记为(X,Y)~N(1,2,1,2,). 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布, 即X~N(1,1),Y~N(2,2). 但是若X~N(1,1),Y~N(2,2),(X,Y)未必是二维正态分布。 (10)函数分布 Z=X+Y 根据定义计算:FZ(z)P(Zz)P(XYz) 222222对于连续型,fZ(z)=f(x,zx)dx 两个独立的正态分布的和仍为正态分布(12,12)。 n个相互独立的正态分布的线性组合,仍服从正态分布。 22Ciii, 2Ci2i2i Z=max,min(X1,X2,„Xn) 若X1,X2Xn相互独立,其分布函数分别为Fx(x),Fx(x)Fx(x),则Z=max,min(X1,X2,„Xn)的分布12n函数为: Fmax(x)Fx(x)Fx(x)Fx(x) 12nFmin(x)1[1Fx(x)][1Fx(x)][1Fx(x)] 12n12
概率论与数理统计 公式
分布 2设n个随机变量X1,X2,,Xn相互独立,且服从标准正态分布,可以证明它们的平方和 nWi1X2i 的分布密度为 1unnf(u)2220,n21u2eu0, u0.22我们称随机变量W服从自由度为n的分布,记为W~(n),其中 n2n0x21exdx. 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。 分布满足可加性:设 Yi(ni), 22则 kZYi1i~(n1n2nk). 2t分布 设X,Y是两个相互独立的随机变量,且 X~N(0,1),Y~(n), 2可以证明函数 TXY/n 的概率密度为 n12t21f(t)nnn2n12 (t). 我们称随机变量T服从自由度为n的t分布,记为T~t(n)。 t1(n)t(n) 13
概率论与数理统计 公式
F分布 设X~(n1),Y~(n2),且X与Y独立,可以证明FX/n1Y/n222的概率密度函数为 n1n22f(y)nn1222n1n1n22n1y21n11yn2n1n22,y0 0,y0我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~f(n1, n2). F1(n1,n2)1F(n2,n1) 第四章 随机变量的数字特征
(1)一维随机变量的数字特征 期望 期望就是平均值 离散型 设X是离散型随机变量,其分布律为P(Xxk)=pk,k=1,2,„,n, n连续型 设X是连续型随机变量,其概率密度为f(x), E(X)xf(x)dx E(X)k1xkpk (要求绝对收敛) (要求绝对收敛) 函数的期望 Y=g(X) nY=g(X) E(Y)k1g(xk)pk E(Y)g(x)f(x)dx 方差 2D(X)=E[X-E(X)], 标准差 (X)D(X), D(X)k[xkE(X)]pk 2D(X)[xE(X)]2f(x)dx 14
概率论与数理统计 公式
矩 ①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即 νk=E(X)= k①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即 νk=E(X)=kixipi, kxkf(x)dx, k=1,2, „. ②对于正整数k,称随机变量X与E(X)差的k次幂的数学期 k=1,2, „. ②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X望为X的k阶中心矩,记为k,的k阶中心矩,记为k,即 即 kE(XE(X)).kkE(XE(X))k k.=i(xiE(X))pi, =(xE(X))kf(x)dx, k=1,2, „. 2k=1,2, „. 切比雪夫不等式 设随机变量X具有数学期望E(X)=μ,方差D(X)=σ,则对于任意正数ε,有下列切比雪夫不等式 P(X)22 切比雪夫不等式给出了在未知X的分布的情况下,对概率 P(X) 的一种估计,它在理论上有重要意义。 (2)期望的性质 (1) E(C)=C (2) E(CX)=CE(X) nn(3) E(X+Y)=E(X)+E(Y),E(CiXi)i1Ci1iE(Xi) (4) E(XY)=E(X) E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 (3)方差的性质 (1) D(C)=0;E(C)=C 2(2) D(aX)=aD(X); E(aX)=aE(X) 2(3) D(aX+b)= aD(X); E(aX+b)=aE(X)+b 22(4) D(X)=E(X)-E(X) (5) D(X±Y)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(X±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))],无条件成立。 而E(X+Y)=E(X)+E(Y),无条件成立。 0-1分布B(1,p) 15
(4)常见分布期望 方差 p(1p) p 概率论与数理统计 公式
的期望和方差 二项分布B(n,p) 泊松分布P() np 1pnMNab2np(1p) 1pp2几何分布G(p) 超几何分布H(n,M,N) nMMNn1 NNN1均匀分布U(a,b) (ba)122 指数分布e() 正态分布N(,) 分布 21 12 2 2n 0 n2n nn2t分布 (5)二维随机变量的数字特征 期望 E(X)(n>2) i1xipi E(X)xfX(x)dx nE(Y)j1yjpj E(Y)yfY(y)dy 函数的期望 E[G(X,Y)]= E[G(X,Y)]= G(xiji,yj)pij G(x,y)f(x,y)dxdy-- 方差 D(X)D(Y)ij[xiE(X)]pi E(Y)]pj 22D(X)[xE(X)]2fX(x)dx [xjD(Y)[yE(Y)]2fY(y)dy 16
概率论与数理统计 公式
协方差 对于随机变量X与Y,称它们的二阶混合中心矩11为X与Y的协方差或相关矩,记为XY或cov(X,Y),即 XY11E[(XE(X))(YE(Y))]. 与记号与相关系数 XY相对应,X与Y的方差D(X)与D(Y)也可分别记为XXYY。 对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称 XY D(Y)D(X)为X与Y的相关系数,记作XY(有时可简记为)。 P(XaYb)1 ||≤1,当||=1时,称X与Y完全相关:正相关,当负相关,当完全相关1时(a0),1时(a0), 而当0时,称X与Y不相关。 以下五个命题是等价的: ①XY0; ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y). 协方差矩阵 XXYXXYYY kl混合矩 对于随机变量X与Y,如果有E(XY)存在,则称之为X与Y的k+l阶混合原点矩,记为kl;k+l阶混合中心矩记为: uklE[(XE(X))(YE(Y))]. kl(6)协方差的性质 (i) (ii) (iii) (iv) cov (X, Y)=cov (Y, X); cov(aX,bY)=ab cov(X,Y); cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y); cov(X,Y)=E(XY)-E(X)E(Y). 17
概率论与数理统计 公式
(7)独立和不相关 (i) (ii) 若随机变量X与Y相互独立,则XY0;反之不真。 若(X,Y)~N(1,2,1,2,), 则X与Y相互独立的充要条件是X和Y不相关。 22第五章 大数定律和中心极限定理
(1)大数定律 X 切比雪夫大数定律 设随机变量X1,X2,„相互独立,均具有有限方差,且被同一常数C所界:D(Xi)概率论与数理统计 公式(2)中心极限定理 XN(,n2) 列维-设随机变量X1,X2,„相互独立,服从同一分布,且具有林德伯相同的数学期望和方差:格定理 2E(Xk),D(Xk)0(k1,2,),则随机变量 nYnk1Xkn n的分布函数Fn(x)对任意的实数x,有 nXnkk1limFn(x)limPxnnnt212xe2dt. 此定理也称为独立同分布的中心极限定理。 棣莫弗-拉普拉斯定理 设随机变量Xn为具有参数n, p(0
(1)数理统计的基本概念 总体 在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。 总体中的每一个单元称为样品(或个体)。 个体 19
概率论与数理统计 公式
样本 我们把从总体中抽取的部分样品x1,x2,,xn称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,x1,x2,,xn表示n个随机变量(样本);在具体的一次抽取之后,x1,x2,,xn表示n个具体的数值(样本值)。我们称之为样本的两重性。 样本函数和统计量 设x1,x2,,xn为总体的一个样本,称 (x1,x2,,xn) 为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称(x1,x2,,xn)为一个统计量。 常见统计量及其性质 样本均值 样本方差 1nxnxi. i1S21n1 ni1(xix). 1n22样本标准差 Sn1 (xix). i1样本k阶原点矩 M1n knxi,k1,2,. ki1样本k阶中心矩 Mk1nn(xix),k2,3,. ki1E(X),D(X)n22, n1n22E(S)22,E(S*)1n, 其中S*2n(XiX),为二阶中心矩。 i120
概率论与数理统计 公式
(2)正态总体下的四大分布 正态分布 设x1,x2,,xn为来自正态总体N(,)的一个样本,则样本函数 def2ux/~N(0,1). n2t分布 设x1,x2,,xn为来自正态总体N(,)的一个样本,则样本函数 tdefxs/n~t(n1), 其中t(n-1)表示自由度为n-1的t分布。 分布 2设x1,x2,,xn为来自正态总体N(,)的一个样本,则样本函数 def2w(n1)S22~(n1), 2其中(n1)表示自由度为n-1的分布。 F分布 2设x1,x2,,xn为来自正态总体N(,1)的一个样本,而22y1,y2,,yn为来自正态总体N(,22)的一个样本,则样本函数 defFS1/S2/222122~F(n11,n21), 其中 S121n1n11(xix), 2S221n2n2i11(yiy); 2i1F(n11,n21)表示第一自由度为n11,第二自由度为n21的F分布。 (3)正态总体下分布的性质 X与S独立。 2第七章 参数估计
21
概率论与数理统计 公式
(1)点估计 矩估计 设总体X的分布中包含有未知数1,2,,m,则其分布函数可以表成F(x;1,2,,m).它的k阶原点矩vkE(Xk)(k1,2,,m)中也包含了未知参数1,2,,m,即vkvk(1,2,,m)。又设x1,x2,,xn为总体X的n个样本值,其样本的k阶原点矩为 1nnxi (k1,2,,m). ki1这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有 1nv1(1,2,,m)xi,ni11n2v2(1,2,,m)xi,ni1 nmv(,,,)1x.m12mini1由上面的m个方程中,解出的m个未知参数(1,2,,m)即为参数(1,2,,m)的矩估计量。 若为的矩估计,g(x)为连续函数,则g(ˆ)为g()的矩估计。 22
概率论与数理统计 公式
极大似然估计 当总体X为连续型随机变量时,设其分布密度为f(x;1,2,,m),其中1,2,,m为未知参数。又设x1,x2,,xn为总体的一个样本,称 nL(1,2,,m)i1f(xi;1,2,,m) 为样本的似然函数,简记为Ln. 当总体X为离型随机变量时,设其分布律为P{Xx}p(x;1,2,,m),则称 nL(x1,x2,,xn;1,2,,m)i1p(xi;1,2,,m) 为样本的似然函数。 2m 若似然函数L(x1,x,,xn;1,,,m)在1,,,22处取2m到最大值,则称1,,,分别为1,,,m的最大似然估计值,2相应的统计量称为最大似然估计量。 lnLni0,i1,2,,m ii 若为的极大似然估计,g(x)为单调函数,则g(ˆ)为g()的极大似然估计。 (2)估计量的评选标准 无偏性 设(x1,x2,,xn)为未知参数的估计量。若E ()=,则称 为的无偏估计量。 E(X)=E(X), E(S)=D(X) 有效性 122设1(x1,x,2,,xn)和2(x1,x,2,,xn)是未知参数的两个无偏估计量。若D(1)D(2),则称1比2有效。 23
概率论与数理统计 公式
一致性 设n是的一串估计量,如果对于任意的正数,都有 limP(|nn|)0, 则称n为的一致估计量(或相合估计量)。 若为的无偏估计,且D(ˆ)0(n),则为的一致估计。 只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。 (3)区置信区间估计 间和置信度 设总体X含有一个待估的未知参数。如果我们从样本x1,x,2,,xn出发,找出两个统计量(12)11(x1,x,2,,xn)与22(x1,x,2,,xn),使得区间[1,2]以1(01)的概率包含这个待估参数,即 P{12}1, 那么称区间[1,2]为的置信区间,1为该区间的置信度(或置信水平)。 单正总体期望方差区间计 态的和的估设x1,x,2,,xn为总体X~N(,)的一个样本,在置信度为1下,我们来确定和的置信区间[1,2]。具体步骤如下: (i)选择样本函数; (ii)由置信度1,查表找分位数; (iii)导出置信区间[1,2]。 已知方差,估计均值 (i)选择样本函数 ux~N(0,1). n220/(ii) 查表找分位数 xP1. 0/n(iii)导出置信区间 00x,x nn24
概率论与数理统计 公式
未知方差,估计均值 (i)选择样本函数 txS/n~t(n1). (ii)查表找分位数 xP1. S/n(iii)导出置信区间 SSx,x nn方差的区间估计 (i)选择样本函数 w(n1)S22~(n1). 2(ii)查表找分位数 (n1)SP12221. (iii)导出的置信区间 n1S,n1S 12第八章 假设检验
基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。 为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。 这里所说的小概率事件就是事件{KR},其概率就是检验水平α,通常我们取α=0.05,有时也取0.01或0.10。 基本步骤 假设检验的基本步骤如下: (i) 提出零假设H0; (ii) 选择统计量K; (iii) 对于检验水平α查表找分位数λ; (iv) 由样本值x1,x2,,xn计算统计量之值K; 将K与进行比较,作出判断:当|K|(或K)时否定H0,否则认为H0相容。 25
概率论与数理统计 公式
两类错误 第一类错误 当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即 P{否定H0|H0为真}=; 此处的α恰好为检验水平。 当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即 P{接受H0|H1为真}=。 第二类错误 两类错误的关系 人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如0.01,甚至0.001。反之,则应把α取得大些。 单正态总体均值和方差的假设检验
条件 H零假设 :0 :0 :0 :0 :0 :0 统计量 对应样本 函数分布 否定域 |u|u102 已知 2HHH0Ux0 0/nN(0,1) uu1 uu1 |t|t1002(n1) 未知 2HH0Tx0S/n t(n1) tt1(n1) tt1(n1) w20未知 2H0:22 w(n1)S22(n1)或26
20 (n1) 2w21 2(n1)
概率论与数理统计 公式
HH0::220 w1(n1) w(n1) 222200
27