1第六章第六章 样本及抽样分布样本及抽样分布2引言引言在概率论中,随机变量的概率分布通常被假定为已在概率论中,随机变量的概率分布通常被假定为已知的,而一切问题的解决均基于已知的分布进行的知的,而一切问题的解决均基于已知的分布进行的但在实际问题中,情况往往并非如此我们所研究但在实际问题中,情况往往并非如此我们所研究的随机变量,它的分布形式未知的或完全不知道的的随机变量,它的分布形式未知的或完全不知道的3 由于大量随机现象必然呈现出它的规律性,因由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈察,被研究的随机现象的规律性一定能清楚地呈现出来现出来.但一般只允许我们对随机现象进行次数不多的观但一般只允许我们对随机现象进行次数不多的观察试验,也就是说察试验,也就是说,我们获得的只是局部观察数据我们获得的只是局部观察数据.数理统计数理统计的任务就是研究怎样有效地的任务就是研究怎样有效地收集、整理、收集、整理、分析分析所获得的所获得的有限有限的数据;对所研究的对象的的数据;对所研究的对象的性质、性质、特点特点作出作出推断和预测推断和预测(统计推断)。
统计推断)大数定律)(大数定律)4它们构成了统计推断的两种基本形式它们构成了统计推断的两种基本形式.这两种推断这两种推断渗透到了数理统计的每个分支渗透到了数理统计的每个分支.现实世界中存在着形形色色的数据现实世界中存在着形形色色的数据,分析这些分析这些数据需要多种多样的方法数据需要多种多样的方法.因此因此,数理统计中的方法和支持这些方法的相数理统计中的方法和支持这些方法的相应理论是相当丰富的应理论是相当丰富的.概括起来可以归纳成两大类概括起来可以归纳成两大类:参数估计参数估计根据数据根据数据,用一些方法对分布的未知用一些方法对分布的未知参数进行估计参数进行估计.假设检验假设检验根据数据根据数据,用一些方法对分布的未知用一些方法对分布的未知参数进行检验参数进行检验.5一、总体与个体一、总体与个体1.总体总体研究对象的全体称为总体研究对象的全体称为总体.(试验的全部可能观(试验的全部可能观察值)察值)研究研究2000名学生的年龄名学生的年龄这些学生的年龄的全体就构成一个总体这些学生的年龄的全体就构成一个总体每个学生的年龄就是个体每个学生的年龄就是个体.2.个体个体构成总体的每个成员称为个体构成总体的每个成员称为个体.(每一个可能的(每一个可能的观察值)观察值)例例6.1 随机样本随机样本6 某工厂某工厂10月份生产的灯泡寿命所组成的月份生产的灯泡寿命所组成的总体中总体中,个体的总数就是个体的总数就是10月份生产的灯泡数月份生产的灯泡数,这是一个有限总体这是一个有限总体;而该工厂生产的所有灯泡寿而该工厂生产的所有灯泡寿命所组成的总体是一个无限总体命所组成的总体是一个无限总体,它包括以往生它包括以往生产和今后生产的灯泡寿命产和今后生产的灯泡寿命.3.有限总体和无限总体有限总体和无限总体例如例如 当有限总体包含的个体的总数很大时当有限总体包含的个体的总数很大时,可近似地可近似地将它看成是无限总体将它看成是无限总体.容量:容量:总体所包含的个体的个数称为总体的容量总体所包含的个体的个数称为总体的容量74.总体分布总体分布总体中的每一个个体是随机试验的一个观察值总体中的每一个个体是随机试验的一个观察值因此它是某一个随机变量因此它是某一个随机变量X的值。
的值总体总体就对应于一个就对应于一个随机变量随机变量XX 的分布函数和数的分布函数和数字特征称为总体的分布函数和数字特征字特征称为总体的分布函数和数字特征.一般不区分总体和对应的随机变量,统称为总体一般不区分总体和对应的随机变量,统称为总体X8例如例如 以以0表示生产线的产品为正品,以表示生产线的产品为正品,以1表示表示次品,设出现次品的概率为次品,设出现次品的概率为p(常数),则总体(常数),则总体由一些由一些“1”和一些和一些“0”所组成这一总体对应于一个具有参数为这一总体对应于一个具有参数为p的(的(0-1)分布)分布:的随机变量,称之为(的随机变量,称之为(0-1)分布总体,意指总体中的观察值是(分布总体,意指总体中的观察值是(0-1)分布随)分布随机变量的值机变量的值1(1),0,1xxP X xppx9二、样本二、样本1.样本的定义样本的定义在实际中,总体的分布(或其中部分参数)一般在实际中,总体的分布(或其中部分参数)一般是未知的可以通过从总体中是未知的可以通过从总体中抽取一部分个体抽取一部分个体,根据获得的个体数据对总体分布作出判断根据获得的个体数据对总体分布作出判断被抽出的部分个体,称为总体的一个被抽出的部分个体,称为总体的一个样本样本 抽取一个个体抽取一个个体:对总体:对总体X进行一次观察并记录其结果。
进行一次观察并记录其结果10 相同条件下,对总体相同条件下,对总体X进行进行n次次重复、独立的重复、独立的观察,观察,结果依次记为结果依次记为X1,X2,Xn,它们都是相互独立、且与,它们都是相互独立、且与X具有相同分布的随机变量称具有相同分布的随机变量称X1,X2,Xn为来自总体为来自总体X的一个的一个简单随机样本简单随机样本,n为这个为这个样本的容量样本的容量通过通过n次观察,得到一组实数次观察,得到一组实数x1,x2,xn,它们依次,它们依次是随机变量是随机变量X1,X2,Xn的观察值,称为的观察值,称为样本值样本值对有限总体,采用放回抽样所得到的样本为对有限总体,采用放回抽样所得到的样本为简单随简单随机样本机样本当样本容量当样本容量 n 与总体容量与总体容量N 相比很小时相比很小时,可将无放可将无放回抽样近似地看作放回抽样回抽样近似地看作放回抽样.(n/N40)(P386)301.282 1.645 1.960 2.327 2.576 3.090 z0.10 0.05 0.025 0.01 0.005 0.001 aa几个常用的几个常用的z z值值标准正态分布的标准正态分布的分位点分位点 31.,)(2可通过查表完成可通过查表完成的值的值求求na a)8(2025.0)10(2975.0)25(21.0 17.534,247.3 34.381,例:例:20.1(40)51.805.2220.10.111(40)(21)(1.28279)51.71622zn 32).(,/,),(),1,0(2ntttnnYXtYXnYNX记记为为分分布布的的服服从从自自由由度度为为则则称称随随机机变变量量独独立立且且设设 t 分布又称分布又称学生氏学生氏(Student)分布分布.12212()1,2nnth ttnnn 分布的概率密度函数为分布的概率密度函数为)(nt以下以下t分布和分布和F分布掌握其定义就够了,其他一般了解即可分布掌握其定义就够了,其他一般了解即可.分布分布33t 分布的概率密度图形关于图形关于对称对称;当当 n 充分大(大于充分大(大于30)时时,其图形类似于标准正其图形类似于标准正态变量概率密度的图形态变量概率密度的图形.t分布的一些重要事实分布的一些重要事实:(1)n1时时,t分布的数学期望存在且为分布的数学期望存在且为0;(2)n2时时,t分布的方差存在且为分布的方差存在且为n/(n-2)(3)当自由度较大当自由度较大(如如n 30)时时,t分布可以用分布可以用N(0,1)分布近似分布近似.34,01,()()().P ttntnt naaaaaa对于给定的称满足条件的为分布的分位数.分位点的值分位点的值得上得上可以通过查表求可以通过查表求a a由分布的对称性知由分布的对称性知).()(1ntnta aa a 分布的分位点分布的分位点 t(P385)a a)(nta a)(1nta a.)(45a aa azntn 时,时,当当3521/nVnUF 3.F分布分布设设 U 2(n1),V 2(n2),且且U,V相互独立相互独立,服从自由度为服从自由度为(n1,n2)的的F分布分布.记为记为 F F(n1,n2).F1),(12nnF1.定义定义).,(/1),(F 1221nnFFnnF则则若若12nUnV称统计量称统计量3612(,)F n n 分布的概率密度为112121212121212221,0,()220,0.nnnnnnnnn yyyynnny 37121212,01,(,)(,)(,).P FFnnFnnF nnaaaaaa对 于 给 定 的称 满 足 条 件的 点为分 布 的分 位 数分布的分位数分布的分位数Fa),(21nnFa a.),(1),(12211nnFnnFa aa a 38(),E X特别地特别地,若若 X N(,2),有有),(2nNX 4.正态总体的样本均值与样本方差的分布正态总体的样本均值与样本方差的分布设总体设总体X的均值为的均值为,方差为方差为 2,X1,X2,Xn是是X的一个样本的一个样本.2(),D Xn)1,0(NnX 22().E S定理一定理一设设X1,X2,Xn是总体是总体 N(,2)的一个样本,则样本的一个样本,则样本均值:均值:39n取不同值时正太总体的样本均值取不同值时正太总体的样本均值 的分布的分布X40.2相互独立相互独立与与SX 对于正态总体的样本方差对于正态总体的样本方差S2,有以下定理有以下定理:定理二定理二X1,X2,Xn是总体是总体 N(,2)的一个样本的一个样本.(1)(2)222(1)(1)nSnn取不同值时取不同值时 的分布的分布22)1(Sn 41 设设X1,X2,Xn是取自正态总体是取自正态总体),(2 N的样本的样本,2SX和和分别为样本均值和样本方差分别为样本均值和样本方差,则有则有)1(/ntnSX 定理三定理三42 定理定理四四(1)(两总体样本方差比的分布两总体样本方差比的分布)22111222221,1SF nnS,设),(),(222211NYNXYX和分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,1nX是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值,均值,2221SS 和则有则有Y1,Y2,2nY是是样本样本43 定理定理四四(2)(2)(两总体样本均值差的分布两总体样本均值差的分布),设设),(),(2221 NYNXYX和和分别是这两个样本的样本均值分别是这两个样本的样本均值,且且X与与Y独立独立,X1,X2,1nX是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,则有则有2221SS 和和Y1,Y2,2nY是是wXYt nnSnn121212()()(2),11 2222112212(1)(1),.2wwwnSnSSSSnn其其中中44练习:设总体为练习:设总体为来自来自的样本,求概率的样本,求概率解:解:212345 (2.5,6),XNXXXXX2(1.33.5)(6.39.6).PXSX2S因为与相互独立,故所求概率为:21.33.5 6.39.6 PPXPS2(2.5,6/5),XN1.33.5PX1.32.52.53.52.56/56/56/5XP3.52.51.32.56/56/5(0.37)(0.45)0.3179 26.39.6PS22224446.39.3666SP20 741 033P.().2240 741 033PP().().0 950 900 05.0.31790.050.0159.2.5(0,1),65XN5,n 由定理一、二可知:2224(4)6S故有:45.2)(12)2(;2)(12 )1(,)16(,),(21222122212 niiniinXXnPXnPXnXXXNX概率概率求求的样本的样本为来自为来自设总体设总体练习练习222211()22niiPXn nXnPnii2)(2212 28(16)32P22(16)8(16)32PP0.950.010.94解解(1):212)(niiX已知已知 niiX12 ),(2n 46(2):212)(niiXX22(1)ns ),1(2 n 22211()22niiPXXn 28(15)32P32)15(8)15(22 PP005.090.0 .895.0 47本章重要知识点本章重要知识点()掌握个常用统计量的定义及其计算()了解3大抽样分布的定义以及正态总体的样本均值和方差的分布的个定理()掌握()中的定义,以及定理一和定理二及其应用 重点掌握重点掌握P21,P44-46的例题及其解题过程和思路。
的例题及其解题过程和思路分布 2。