文档详情

第六章 假设检验

痛***
实名认证
店铺
PPT
319.50KB
约30页
文档ID:157804599
第六章 假设检验_第1页
1/30

第六章第六章 假设检验假设检验6.1 假设检验的基本问题假设检验的基本问题一、假设检验的陈述一、假设检验的陈述 在自然科学和社会科学研究中,经常要提出一些假设,然在自然科学和社会科学研究中,经常要提出一些假设,然后要判断或检验这些假设是否正确例如我们在用反证法后要判断或检验这些假设是否正确例如我们在用反证法证明数学命题或题目时,需要做一个假设,然后利用已有证明数学命题或题目时,需要做一个假设,然后利用已有的知识和命题的条件推导出矛盾来,从而否定所做的假设,的知识和命题的条件推导出矛盾来,从而否定所做的假设,证明了原命题的正确性证明了原命题的正确性在用统计学研究问题时,也经常根据实际问题提出假设,在用统计学研究问题时,也经常根据实际问题提出假设,然后利用样本统计量判断然后利用样本统计量判断 假设是否正确的过程,这就是假设是否正确的过程,这就是假设检验为了讲清楚这个内容,我们先介绍假设检验的假设检验为了讲清楚这个内容,我们先介绍假设检验的有关知识有关知识1、小概率事件不发生原理、小概率事件不发生原理小概率事件(发生概率小于小概率事件(发生概率小于0.1 的事件)发生的概率很小,的事件)发生的概率很小,在一次试验中认为它不发生在一次试验中认为它不发生。

例如我们知道人们乘车都有例如我们知道人们乘车都有发生交通事故的可能,但是人们依据小概率事件在一发生交通事故的可能,但是人们依据小概率事件在一 次试验中不发生原理,照样乘车、乘飞机等次试验中不发生原理,照样乘车、乘飞机等2、假设检验问题的提出、假设检验问题的提出在用统计学研究自然科学和社会科学问题时,有时提出一在用统计学研究自然科学和社会科学问题时,有时提出一个假设,这个假设称为原假设,然后依据小概率事件在一个假设,这个假设称为原假设,然后依据小概率事件在一次试验中不发生原理,检验这个假设正确与否次试验中不发生原理,检验这个假设正确与否例例1 某超市从厂家进货,双方达成协议,如果次品率超某超市从厂家进货,双方达成协议,如果次品率超过过1%,则超市拒收货物,今有一批货物,随机抽取,则超市拒收货物,今有一批货物,随机抽取200件检查,发现有次品件检查,发现有次品3件,在显著性水平件,在显著性水平 下,下,试问超市是否要接受这批货物?试问超市是否要接受这批货物?作为超市来说,可以提出一个假设:次品率小于或等于作为超市来说,可以提出一个假设:次品率小于或等于1%,再抽取样本,检验这个假设对不对,再抽取样本,检验这个假设对不对,若假设成立,就若假设成立,就允许这批货物进入超市,相反,若假设不成立,就拒绝这允许这批货物进入超市,相反,若假设不成立,就拒绝这批货物进入超市。

现在问题的关键在于如何判断这批货物批货物进入超市现在问题的关键在于如何判断这批货物的次品率是否超过的次品率是否超过1%,有些同学可能会说可以抽一部分,有些同学可能会说可以抽一部分 0.05货物进行检测一下,看看这部货物次品率是否超过货物进行检测一下,看看这部货物次品率是否超过1%,由于你抽取的货物是随机的,因此所抽查货物的次品率也由于你抽取的货物是随机的,因此所抽查货物的次品率也是随机的为此,我们假定前面的假设是正确的,在这基是随机的为此,我们假定前面的假设是正确的,在这基础上计算题目中的事件础上计算题目中的事件A:“随机抽取产品中次品率不超随机抽取产品中次品率不超过过1%”发生的概率发生的概率1)在(在(1)式中,)式中,z 正好是统计量,并且其分布是标准正态正好是统计量,并且其分布是标准正态 60.010.01200()(1)0.01(1 0.01)2002.6190.0044pP AP zppnP z分布,计算结果及示意图是分布,计算结果及示意图是 y 0.0044 2.61 x从(从(1)的计算结果可以看出,在超市提出的假设成立的)的计算结果可以看出,在超市提出的假设成立的情况下,随机抽取的情况下,随机抽取的200件产品中,有件产品中,有6件是次品的概率件是次品的概率为为0.0044,显然这是一个小概率事件,认为在一次抽查中,显然这是一个小概率事件,认为在一次抽查中不应该发生,现在它发生了,我们怀疑超市提出的假设不不应该发生,现在它发生了,我们怀疑超市提出的假设不应该成立。

也就是拒绝这批产品进入超市应该成立也就是拒绝这批产品进入超市在这个例子中,超市提出了假设,通过抽样获得样本数在这个例子中,超市提出了假设,通过抽样获得样本数据和统计量的分布,计算出这个假设成立的概率很小,是据和统计量的分布,计算出这个假设成立的概率很小,是小概率事件,再根据小概率事件在一次试验中不发生原理,小概率事件,再根据小概率事件在一次试验中不发生原理,拒绝了产品进入超市这个过程就是统计学中重要内容拒绝了产品进入超市这个过程就是统计学中重要内容假设检验假设检验3、原假设和备择假设、原假设和备择假设原假设(原假设(null hypothesis):指研究者想收集证据予以反):指研究者想收集证据予以反驳的假设通常用驳的假设通常用 表示备择假设(备择假设(alternative hypothesis):指研究者想收集):指研究者想收集证据予以支持的假设通常用证据予以支持的假设通常用 表示例如例如 在例在例1中,中,“次品率小于或等于次品率小于或等于1%”是超市想反驳的是超市想反驳的假设,是原假设它的对立面假设,是原假设它的对立面“次品率大于次品率大于1%”是超市想是超市想支持的假设,是备择假设。

支持的假设,是备择假设4、两类错误和显著性水平、两类错误和显著性水平 第一类错误:第一类错误:原假设是真的,但在检验中被错误地拒绝了原假设是真的,但在检验中被错误地拒绝了第二类错误:原假设是假时,没有拒绝而错误地被接受了第二类错误:原假设是假时,没有拒绝而错误地被接受了0H1H这两类错误之间的关系是:在样本容量一定时,犯第一类这两类错误之间的关系是:在样本容量一定时,犯第一类错误概率较大时,犯第二类错误地概率较小;反之,犯第错误概率较大时,犯第二类错误地概率较小;反之,犯第一类错误概率较小时,犯第二类错误概率较大要想两类一类错误概率较小时,犯第二类错误概率较大要想两类错误的概率都减小,只有增加样本容量错误的概率都减小,只有增加样本容量5、显著性水平、显著性水平显著性水平:是指人们犯第一类错误概率的最大允许值显著性水平:是指人们犯第一类错误概率的最大允许值注意:显著性水平是人们根据自己所研究的问题来确定,注意:显著性水平是人们根据自己所研究的问题来确定,在经济学和其他社会科学中,常用选择的显著性水平是在经济学和其他社会科学中,常用选择的显著性水平是5%,或者或者10%,在卫生和医药统计中,常用选择的显著性水平,在卫生和医药统计中,常用选择的显著性水平是是1%。

在我们经济学中,除非特别声明,一般都以在我们经济学中,除非特别声明,一般都以5%作作为显著性水平为显著性水平6、临界值和拒绝域、临界值和拒绝域 拒绝域:拒绝域就是由显著性水平拒绝域:拒绝域就是由显著性水平 所围城的区域所围城的区域临界值:由给定的显著性水平确定的拒绝域的边界值,称临界值:由给定的显著性水平确定的拒绝域的边界值,称为临界值实际上临界值就是为临界值实际上临界值就是 分位点所对应的值分位点所对应的值例例2 某地区小麦的一般生产水平是亩产某地区小麦的一般生产水平是亩产250公斤,其标准公斤,其标准差是差是6公斤现在经过品种改良试验,从公斤现在经过品种改良试验,从25个小区抽样,个小区抽样,结果为小麦平均亩产比原来提高结果为小麦平均亩产比原来提高20公斤对检验假设公斤对检验假设 ,的问题,求的问题,求 时,不犯第二类错误的概率假设小麦亩产服从正态分布时,不犯第二类错误的概率假设小麦亩产服从正态分布()解:该地区小麦的一般生产水平是亩产解:该地区小麦的一般生产水平是亩产250公斤,标准差公斤,标准差是是6公斤,可以认为该地区小麦产量在品种改良前是服从公斤,可以认为该地区小麦产量在品种改良前是服从正态分布正态分布 。

现在经过品种改良后,从现在经过品种改良后,从25个个样本数据来看,亩产比原来提高了样本数据来看,亩产比原来提高了20公斤,现在的问题公斤,现在的问题是这提高了的是这提高了的20公斤偶然的还是必然的(如果是偶然的,公斤偶然的还是必然的(如果是偶然的,意味着品种改良没有提高小麦的产量,如果是必然的意味意味着品种改良没有提高小麦的产量,如果是必然的意味着着品种改良的确提高了小麦的产量)为此,我们用假设检品种改良的确提高了小麦的产量)为此,我们用假设检方法来解决此问验题方法来解决此问验题0:250H1:250H2700.052(250,6)N方法来解决此问验题方法来解决此问验题根据上述分析,提出原假设和备择假设是:根据上述分析,提出原假设和备择假设是:构造检验统计量构造检验统计量 在原假设成立时在原假设成立时,它服从标准正态分布,其分布密度函,它服从标准正态分布,其分布密度函数图形是数图形是 1.6501:250:250HH2506xxz0.05在原假设成立时,检验统计量在原假设成立时,检验统计量z的值超过的值超过1.65概率小于或概率小于或者等于者等于0.05,这是一个小概率事件,在一次试验中不应,这是一个小概率事件,在一次试验中不应该发生,如果发生,我们就有只够的理由否定原假设了。

该发生,如果发生,我们就有只够的理由否定原假设了下面我们来计算一下检验统计量下面我们来计算一下检验统计量z 的值是多少根据题意,的值是多少根据题意,z=270-250/6=3.331.65,因此我们要拒绝原假设:小麦,因此我们要拒绝原假设:小麦改良后亩产仍然是改良后亩产仍然是250公斤也就是说,认为小麦经过改公斤也就是说,认为小麦经过改良后亩产已经超过良后亩产已经超过250公斤0.05就称为显著性水平就称为显著性水平Z1.65的区域称为拒绝域的区域称为拒绝域Z=1.65称为临界值称为临界值下面我们来计算不犯第二类错误的概率,为此下面我们来计算不犯第二类错误的概率,为此 先算出犯先算出犯第二错误的概率根据第二类错误的定义,原假设是错第二错误的概率根据第二类错误的定义,原假设是错误的,备择假设是对的,但是我们错误地误的,备择假设是对的,但是我们错误地 接受了原假设接受了原假设(错误地没有拒绝原假设)备择假设是(错误地没有拒绝原假设)备择假设是 ,有无数多个,为计算犯第二类错误,必须选择其中一个,有无数多个,为计算犯第二类错误,必须选择其中一个,本例选择的是本例选择的是 ,其计算过程及有关图形如下:,其计算过程及有关图形如下:2502700.052502700C在上图中,在上图中,是在检验时,检验统计量临界值所对应是在检验时,检验统计量临界值所对应的在原分布中的值,其计算过程是:的在原分布中的值,其计算过程是:0C000.052502500.051.6566CXP XCPZ所以有所以有 因此犯第二类错误的概率是因此犯第二类错误的概率是 所以不犯第二类错误的概率是所以不犯第二类错误的概率是 10.0465=0.9535 06 1.65250259.9C 0027027066259.92701.68(1.68)61(1.68)0.0465CXP XCPP z 7、单边检验和双边检验、单边检验和双边检验(1)单边检验)单边检验在假设检验中,如果拒绝域在检验统计量分布密度函数一在假设检验中,如果拒绝域在检验统计量分布密度函数一侧的检验,称为侧的检验,称为 单边检验。

例如单边检验例如1)0010:HH2)0010:HH注意:在单边检验中,若原假设是注意:在单边检验中,若原假设是 形式形式拒绝域在右侧;反之,若原假设是拒绝域在右侧;反之,若原假设是 形式形式拒绝域在左侧拒绝域在左侧2)双边检验)双边检验拒绝域在两边的假设检验,称为双边检验拒绝域在两边的假设检验,称为双边检验例如例如 检验检验 00:H10:H0010:HH22例例3 在在20世纪世纪60年代,美国货币主义学派代表人物著名年代,美国货币主义学派代表人物著名经济学家弗理德曼提出了一种经济学家弗理德曼提出了一种“负收入税负收入税”,对低收入者对低收入者进行补助,而不是向他们收税这项福利计划造成受益进行补助,而不是向他们收税这项福利计划造成受益人不工作吗?在新泽西州的三个城市做了一项实验来寻人不工作吗?在新泽西州的三个城市做了一项实验来寻求答求答案总体是由这些城市一万个低收入家庭组成从中选案总体是由这些城市一万个低收入家庭组成从中选出出225个家庭实施负收入税,个家庭实施负收入税,400个家庭作为对照假定这个家庭作为对照假定这400个家庭不会因为别人获得补助而对自身产生影响对个家庭不会因为别人获得补助而对自身产生影响。

对这这625个家庭跟踪个家庭跟踪3年1)对照家庭在)对照家庭在3年平均受雇工作年平均受雇工作7000小时,标准差是小时,标准差是3900小时,获益家庭平均受雇工作小时,获益家庭平均受雇工作6200小时,标准差是小时,标准差是3400小时问获益家庭平均工作时间是否少于对照家庭?小时问获益家庭平均工作时间是否少于对照家庭?(2)对照家庭中,有)对照家庭中,有88%的户主受雇,而实施负收入税的户主受雇,而实施负收入税的家庭,有的家庭,有82%的户主受雇问实施负收入税的家庭户的户主受雇问实施负收入税的家庭户主受雇率是否低于对照组家庭的户主?主受雇率是否低于对照组家庭的户主?解:假设解:假设 分别表示获益家庭和对照家庭在分别表示获益家庭和对照家庭在3年内年内的平均工作时间的平均工作时间根据题意,作如下检验:根据题意,作如下检验:设设 ,分别表示获益家庭和对照家庭分别表示获益家庭和对照家庭样本的平均工作时间和户数,样本的平均工作时间和户数,分别是两组家分别是两组家庭工作时间的方差构造检验统计量庭工作时间的方差构造检验统计量12和012112:HH12xx和12nn和2212和1212221212()()xxznn在原假设成立的情况下,检验统计量在原假设成立的情况下,检验统计量 服从标准正态分布。

服从标准正态分布1.650.0522620070002.671.6539003400400225z 所以,我们不能拒绝原假设,也就是说接受原假设即认所以,我们不能拒绝原假设,也就是说接受原假设即认为实施负收入税的家庭工作时间比没有实施负收入税的家为实施负收入税的家庭工作时间比没有实施负收入税的家庭的平均工作时间要少些庭的平均工作时间要少些2)设)设 表示实施负收入税家庭和没有实施负收表示实施负收入税家庭和没有实施负收入税家庭的户主受雇比例,入税家庭的户主受雇比例,分别表示这两类分别表示这两类样本家庭受雇的比例检验如下:样本家庭受雇的比例检验如下:构造如下检验统计量:构造如下检验统计量:12和12pp和012112:HH在原假设成立时,上述检验统计量服从标准正态分布其在原假设成立时,上述检验统计量服从标准正态分布其检验如下:检验如下:1.651212112212()()(1)(1)ppzppppnn0.050.82 0.881.978 1.650.82 0.180.88 0.12225400z从上式可以看出,检验统计量的值小于临界值,我们不能从上式可以看出,检验统计量的值小于临界值,我们不能拒绝原假设,即接受原假设,认为实施负收入税,会影响拒绝原假设,即接受原假设,认为实施负收入税,会影响户主受雇率。

户主受雇率综上所述,可以看出,实施负收入税确实会导致一部分家综上所述,可以看出,实施负收入税确实会导致一部分家庭或个人不愿意工作正因为如此,美国也没有实施负收庭或个人不愿意工作正因为如此,美国也没有实施负收入税二、用二、用P值进行检验值进行检验P值是指在假设检验中,当原假设成立时,检验统计量取值是指在假设检验中,当原假设成立时,检验统计量取样本数据的值时的概率例如样本数据的值时的概率例如 在下列检验中,其在下列检验中,其P值是值是 p值值=当当P值小于显著性水平时,表明检验统计量的值落在拒接值小于显著性水平时,表明检验统计量的值落在拒接域,我们拒绝原假设;反之,当域,我们拒绝原假设;反之,当P值大于显著性水平时,值大于显著性水平时,表明表明 检验统计量的值落在接受域检验统计量的值落在接受域 内,我们应该接受原假内,我们应该接受原假设0010:HHzzp xzzzp值值案例分析题案例分析题:新饲料养牛计划的有效性检验新饲料养牛计划的有效性检验一家饲料开发公司研究出一种新饲料,据称该饲料能有效一家饲料开发公司研究出一种新饲料,据称该饲料能有效增加牛的体重,同时还能有助于牲畜抵抗某些疾病增加牛的体重,同时还能有助于牲畜抵抗某些疾病。

饲饲料开发公司在一家养牛厂的协作下,对新饲料的功效进行料开发公司在一家养牛厂的协作下,对新饲料的功效进行了检测这家养牛厂的主人从了检测这家养牛厂的主人从2月月1日到日到5月月20日(含首尾日(含首尾两日)使用新饲料喂养一群牛该群牛的有关数据如下表两日)使用新饲料喂养一群牛该群牛的有关数据如下表所示饲料开发公司还得到了这家养牛厂去年一月饲料开发公司还得到了这家养牛厂去年一月15日到五月日到五月5日(含首尾两日)一群牛的喂养数据这群牛使用的是该日(含首尾两日)一群牛的喂养数据这群牛使用的是该饲料公司生产的标准饲料这批数据记录如下:饲料公司生产的标准饲料这批数据记录如下:1、初期平均体重、初期平均体重=178公斤;标准差公斤;标准差=25公斤(公斤(N=43)2、期末平均体重、期末平均体重=251公斤;标准差公斤;标准差=61公斤(公斤(N=41)3、平均每天体重增加、平均每天体重增加0.91公斤;标准差公斤;标准差=0.2公斤(公斤(N=41)4、病牛头数(含两头、病牛头数(含两头 已死亡的)已死亡的)=12头头初始体重初始体重/公斤公斤 期末体重期末体重/公斤公斤是否染病是否染病 7764897168768990936285917490937280837892657476736770786211410314993101115145119153891331421241421521351511271021491271231321321221261471110111010111101100111111111讨论题讨论题 1、检验食用新饲料和标准饲料的两群牛的初期体重均值没、检验食用新饲料和标准饲料的两群牛的初期体重均值没有显著差异。

有显著差异2、检验这两群牛的日平均增重相同检验这两群牛的日平均增重相同3、检验这两群牛的患病率相同检验这两群牛的患病率相同4、讨论检验中所使用的显著性水平对检验结果的影响讨论检验中所使用的显著性水平对检验结果的影响5、给出检验的、给出检验的P值,并指出它的实际意义值,并指出它的实际意义解:解:1)设)设 分别表示食用新饲料和标准饲料的两分别表示食用新饲料和标准饲料的两群牛的初期体重,根据题意,检验的假设是群牛的初期体重,根据题意,检验的假设是 因此,我们构造的检验统计量是:因此,我们构造的检验统计量是:012112:HH12和1212221212()()xxzssnn(1)计算出使用新饲料喂养的牛群的均值和方差是计算出使用新饲料喂养的牛群的均值和方差是 所以,在原假设成立时,有所以,在原假设成立时,有21177.92,101.328xs77.92 1785.51101.3286252843z 显然检验统计量显然检验统计量z 的绝对值大于显著性水平为的绝对值大于显著性水平为5%的临界的临界值值 1.96,故拒绝原假设,认为这两群牛的初期体重有显,故拒绝原假设,认为这两群牛的初期体重有显著差异。

其检验示意图如下著差异其检验示意图如下 0.025 0.025 2)用)用 分别表示食用新饲料和标准饲料的牛日平分别表示食用新饲料和标准饲料的牛日平均增重量,根据题意,要检验的是如下的假设均增重量,根据题意,要检验的是如下的假设构造检验统计量是构造检验统计量是1.961.9612和012112:HH1212221212()()xxzssnn(2)代入有关数据得代入有关数据得 所以,我们拒接原假设,即认为两种饲料喂养的牛群日增所以,我们拒接原假设,即认为两种饲料喂养的牛群日增加的体重量是不同的加的体重量是不同的220.4468 0.911.971.961.53 100.22841z作业:作业:P207 练习题练习题114 (题目可以不抄,但必须复印在纸上(题目可以不抄,但必须复印在纸上 并贴在作业本上并贴在作业本上。

下载提示
相关文档
正为您匹配相似的精品文档