文档详情

统计学第七章、第八章课后题答案

ba****u6
实名认证
店铺
DOCX
90.35KB
约29页
文档ID:168057854
统计学第七章、第八章课后题答案_第1页
1/29

统计学复习笔记第七章参数估计一、考虑题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量估计量也是随机变 量如样本均值,样本比例、样本方差等根据一个详细的样本计算出来的估计量的数值称为估计值2. 简述评价估计量好坏的标准〔1〕无偏性:是指估计量抽样分布的期望值等于被估计的总体参数〔2〕有效性:是指估计量的方差尽可能小对同一总体参数的两个无偏估 计量,有更小方差的估计量更有效〔3〕一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体 的参数3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间 置信区间的阐述是由区间和置信度两局部组成有些新闻媒体报道一些调查结果 只给出百分比和误差〔即置信区间〕,并不说明置信度,也不给出被调查的人数, 这是不负责的表现因为降低置信度可以使置信区间变窄〔显得“准确〃〕有 误导读者之嫌在公布调查结果时给出被调查人数是负责任的表现这样那么可 以由此推算出置信度〔由后面给出的公式〕,反之亦然4. 解释95%的置信区间的含义是什么置信区间95%仅仅描绘用来构造该区间上下界的统计量(是随机的)覆盖总体 参数的概率。

也就是说,无穷次重复抽样所得到的所有区间中有95%〔的区间〕 包含参数不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区 间以0.95的概率覆盖总体参数5. 简述样本量与置信程度、总体方差、估计误差的关系1. 估计总体均值时样本量n为(z y b 2n = 曲a 其中•E 2 ~ 、•2. 样本量n与置信程度1-a、总体方差尸、估计误差E之间的关系为・与置信程度成正比,在其他条件不变的情况下,置信程度越大,所 需要的样本量越大;・ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;・ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以承 受的估计误差的平方越大,所需的样本量越小二、练习题1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为251) 样本均值的抽样标准差° x等于多少?2) 在95%的置信程度下,估计误差是多少?解:1〕o = 5, n = 40, = 2牙a• a =二■—・•・ a豈=5 /V40 0.79•X2〕 Z(s/2二可J0釘二1・光a• • E = z• © 2・•・ 估计误差E = 1.96X52/40心1.552. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

1) 假定总体标准差为15元,求样本均值的抽样标准误差2) 在95%的置信程度下,求估计误差a3)假如样本均值为120元,求总体均值A的95%的置信区间解: 1〕o = 15,n = 49◎三=15FV49 = 2.142〕・•・ 估计误差E = 1.96X15^749心4.23〕 = 120*•*置信区间为x 土E・•・ 其置信区间=120土 4.23・ 从一个总体中随机抽取n =100的随机样本,得到x=104560, 假定总体标准差g 85414,试构建总体均值A的95%的置信区间解:n =100, =104560, g= 85414, 1-a=95% ,耳扭二可斶二 136由于是正态总体,且总体标准差总体均伽在1-a置信程度下的置信区间为=叫谄舗护土1012596X85414^7100144=105.36 土 3.92匚(10045609.土) 67414・ 从总体中抽取一个n =100的简单随机样本,得到x=81, s=12 要求:1) 构建A的90%的置信区间2) 构建A的95%的置信区间3) 构建A的99%的置信区间解:由于是正态总体,但总体标准差未知总体均值卩在1-a置信程度下的置信区间公式为81 土 忑昭,12^/100 = 81土 弘旷X1.21〕1—a=90%,左昭二一 1.65其置信区间为81 土 1.982〕1-a=95% ,春二珂025 = 1 玄其置信区间为81 土 2.3523) 1-a=99%, ±翻=-2.58其置信区间为81 土 3.0965・ 利用下面的信息,构建总体均值的置信区间。

1) x = 25, a= 3.5, n =60,置信程度为 95%2) x =119, s =23.89, n =75,置信程度为 98%3) x =3・149, s =0.974, n =32,置信程度为 90%C s解:T x 土 z 或x 土 z (c未知知)阪,n 抵,n・:1〕 1-a=95% , J廿其置信区间为:25土 1.96X3.5160=25土 0.8852〕 1-a=98%,那么a=0.02, a/2=0.01, 1-a/2=0.99,查标准正态分布表,可知:◎ =2 33其置信区间为:119 ±2.33X23.892/75=119 土6.3453) 1—a=90%,比扭=1.65其置信区间为:3.149±1.65X0.9742/32=3.149 土0.2846・ 利用下面的信息,构建总体均值A的置信区间:1)总体服从正态分布,且o = 500 , n = 15 , =8900,置信程度为 95%解:N=15,为小样本正态分布,但6那么1-a=95%, F =珂叱i-先其置信区间公式为x + z = 105.36 +1.96 x險口 n1025・・・置信区间为:8900±1.96X5002/15=辺邮5©6,土3.915?.2〕 = (101.44,109.28)2) 总体不服从正态分布,且o = 500 , n = 35 , =8900,置信程度为95%。

解:为大样本总体非正态分布,但6那么1-a = 95%,,咽二珂S5 i-先其置信区间公式为x + z = 105.36 +1.96 x險口 n1025・•・置信区间为:8900±1.96X5002 /35二=7?5369t3.99^66.1)= (101.44,109.28)3) 总体不服从正态分布,o未知,n = 35, x =8900, s =500,置信程度为90%解:为大样本总体非正态分布,且o未知,1-a=90%, X翻-1.65 I wX±Z a -其置信区间为: 8900±1.65X5002 /35二〔8761 9039〕4)总体不服从正态分布,o未知,n = 35,兀=8900, s =500,置信程度为99%解:为大样本总体非正态分布,且O未知,1- =99%, X昭二2.58其置信区间为:盖—鼻皿赢一8900土 2.58X500^7 35=〔8681.9 9118.1〕7・ 某大学为理解学生每天上网的时间,在全校7500名学生中采 取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下 面的数据(单位:小时〔略1求该校大学生平均上网时间的置信区 间,置信程度分别为90%解:先求样本均值:疋=专 =3.32■7 — -TI 2^1 再求样本标准差: ¥ «-1牙土需 g -置信区间公式:一 ”肩8・ 从一个正态总体中随机抽取样本量为8的样本,各样本值分别 为:10, 8, 12, 15, 6, 13, 5, 11。

求总体均值A的95%置信区间 解:此题为一个小样本正态分布,o未知X = z先求样本均值: —用 =80三8=10再求样本标准差: 〕 母-1 = 7 84/7 = 3.4641于是,毘的置信程度为1-◎的置信区间是1-^=0.95, n = 8,那么 ^=0.05, a/2=0.025,查自由度为nT=7的艺分布表得临界值切一 2.45所以,置信区间为:10土 2.45X3.46412/79・ 某居民小区为研究职工上班从家里到单位的间隔,抽取了由16个人组成的一个随机样本,他们到单位的间隔分别是:10, 3,14, 8, 6, 9, 12, 11, 7, 5, 10, 15, 9, 16, 13, 2假设总体服从正态分布,求职工上班从家里到单位平均间隔 的95%的置信区 间解:小样本正态分布,未知n= 16, 1-那么flf=0.05, a /2=0.025,查自由度为n-1二15的f分布表得临界值 哦一2.14_ *x= 一样本均值 =150/16=9.375g 二〔2^ 再求样本标准差: V 母-1 = /253.75/15 4.11于是,毘的置信程度为1-◎的置信区间是9.375 ±2.14X4.112/1610・从一批零件是随机抽取36个,测得其平均长度是149.5,标准 差是1・93。

1) 求确定该种零件平均长度的95%的置信区间2) 在上面估计中,你使用了统计中的哪一个重要定理?请解释解:1〕这是一个大样本分布N=36, = 149.5, S =1.93, 1- 0=0.95,=珂J025 =136其置信区间为: 149.5 ±1.96X1.93三V362〕中心极限定理论证:假如总体变量存在有限的平均数和方差, 那么,不管这个总体的分布如何,随着样本容量总的增加,样本均 值的分布便趋近正态分布在现实生活中,一个随机变量服从正态分 布未必很多,但是多个随机变量和的分布趋于正态分布那么是普遍存 在的样本均值也是一种随机变量和的分布,因此在样本容量垃充 分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估 计理论提供了理论根底11・ 某企业消费的袋装食品采用自动打包机包装,每袋标准重量为 100克,现从某天消费的一批产品中按重复抽样随机抽取50包进展 检査,测得每包重量如下:〔略)食品包重服从正态分布,要求:1) 确定该种食品平均重量的95%的置信区间2) 假如规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间解:1〕此题为一个大样本正态分布,o未知°N=50, A =100, l-a=0.95,%宦=左OJO25 = 136。

①每组组中值分别为97、99、101、103、105,即此50包样本平均值左二〔97+99+101+103+105〕/5 = 101②样本标准差为:V{〔97-101〕2X2+〔99-101〕2x3+〔101-101〕2X34+〔103T01〕2X7+〔105T01〕2X4}三〔50-1〕 心 L666―|— "7 —③其置信区间为: 101 ±1.96X1.666三V502〕・・・不合格包数〔V100克〕为2+3=5包,5/50 = 10% (不合格率〕,即P = 90%・・・该批食品合格率的95%置信区间为:p ±Z一鬥0.9 ±1.96XV(0.9X0.1)三50= 0.9 ±1.96X0.04212・ 假设总体服从正态分布,利用下面的数据构建总体均值u的 99%的置信区间略)re解:X =—一样本均值 找Ed商样本标准差: ” 幵-1尽管总体服从正态分布,但是样本n=25是小样本,且总体标対的置信程度为1—4的置信区间是准差未知,应该用 T统计量估计l-a=0.99,那么a=0.01, a/2=0.005,查自由度为n-1二24的£分布表得临界值,%一 2.8②样本均值& = 244/18 = 13.5613・ 一家研究机设想估计在网络公司工作的员工每周加班的平均 时间,为此随机抽取了 18个员工,得到他们每周加班的时间数据如 下〔单位:小时〕:〔略〕假定员工每周加班的时间服从正态分布,估计网络公司员工平均 每周加班时间的90%的置信区间。

解:①N二18 V 30,为小样本正态分布,样本标准差: 二③ 1-a 二 90%, a 二 0.1,a/2= 0.05,那么查自由度为 n-1 二17的艺分布表得临界值‘% — 1.74④0的置信程度为1-口的置信区间是14・利用下面的样本数据构建总体比例丌的置信区间:1) n =44, p = 0.51 ,置信程度为 99%2) n =300, p = 0.82,置信程度为 95%3) n =1150, p = 0. 48,置信程度为 90%解:1〕1-a= 99%, a二 0.01,a/2= 0.005, l-a/2二 0.995, 查标准正态分布表,那么%忌=2.582〕1-a=95%, % 二加5 =3〕1-a=90%,忑翻=1.65分别代入15・在一项家电市场调查中,随机抽取了 200个居民户,调査他们 是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23% 求总体比例的置信区间,置信程度分别为90%和95%解:1〕置信程度 90%, 1-a=90%, 翻=1.65, N = 200 P = 23%2〕置信程度 95%, 1-a=95%,张二可血 i^, N = 200, P =p iZ /23%。

代入 呀16・ 一位银行的管理人员想估计每位顾客在该银行的月平均存款额他假设所有顾客月存款额的标准差为1000元,要求的估计误差 在200元以内,置信程度为99%应选取多大的样本?解: 1-a = 99%,那么弘心=258E = 200, 1000 元那么 N 二 严呻2Xo2〕^e2= 〔2.582 X 10002〕^2002 ^167〔得数应该是166.41,不管小数后是多少,都向上进位取整,因此 至少是167人〕17・要估计总体比例丌,计算以下条件下所需的样本量1) E二0. 02,丌二0.40,置信程度 96%2) E=0.04,丌未知,置信程度 95%3) E二0. 05,丌二0.55,置信程度 90%解:1〕 1-a = 96%,a/2 =0.02,那么工叩=2.06N = {%2X 丌仃-丌〕} FE2 =2.062 X0.4X0.6三0.022 ~25472) 1-a = 95%,a/2 =0.025,那么='1.96开未知,那么取使开〔1-开〕最大时的0.5N =厲护乂丌(1-丌〕 FE2 =1.962 X0.5X0.5^0.042 ^6013〕置信程度 90%, 1- =90%,忑翻=1.65,N= {应翻2X丌(1一丌〕FE2=1.652 X0.55X0.45三0.052 ^27018・ 某居民小区共有居民500户,小区管理者准备采用一项新的供 水设施,想理解居民是否赞成。

采取重复抽样方法随机抽取了 50户, 其中有32户赞同,18户反对1) 求总体中赞成该项改革的户数比例的置信区间&=0・05〕2) 假如小区管理者预计赞成的比例能到达80%,估计误差 不超过10%,应抽取多少户进展调查〔a=0・05〕解:1〕N=50, P=32/50=0.64,a=0.05,a/2 =0.025,那么工啲=1.96 置信区间:P土芒皿 V {P〔1-P〕/N}= 0.64±1.96 70.64X0.36/50=0.64 ±1.96X0.48/7.07=0.64土 0.1332〕丌=0.8, E = 0.1, a=0.05,a/2 =0.025,那么= 1.96 N= 6,丌(1-丌)庄2二 1.962 X0.8X0.2^0.12^6219・根据下面的样本结果,计算总体标准差o的90%的置信区间: 1〕=21, S=2, N=502〕=1.3, S二0.02, N=153)『二167, S=31, N=22解:1〕大样本,未知,置信程度90%, 1-a=90%, E辭=1.65-g _21土 1.65X2FV502〕小样本,未知,置信程度90%, 1-a=90%,那么查自由度为n-1二14的£分布表得临界值‘%—1.761=1.3 ±1.761X0.022/153)大样本,。

未知,置信程度90%, 1-a=90%^ ^ = 1.65 牙土肾 g -167土 1.65X31FV2220.题目(略)1) 构建第一种排队方式等待时间标准差的95%的置信区间2) 构建第二种排队方式等待时间标准差的95%的置信区间3) 根据1)和2)的结果,你认为哪种排队方式更好?解:此题为小样本正态分布,未知,应用公式置信程度95%,1-a=95%,那么查自由度为n-1 = 9的f分布 表得临界值‘%—2.311〕花 7.15,\ 母—1 = 7 2.045/9^0.48其置信区间为7.15±2.31X0.48三7102) 2= 7.15其置信区间为7.15±04)第二种排队方式更好.〔19 题是对总体方差的估计,应该用卡方统计量进展估计,20 题 是对两个总体参数的估计,这二种类型教师未讲,不是本次考试的内 容,不能用z统计量像估计总体均值和比例那样去估计,详细内容见 书上P188——P194〕第八章假设检验一、 考虑题1. 假设检验和参数估计有什么一样点和不同点? 解:参数估计与假设检验是统计推断的两个组成局部一样点:它们都是利用样本对总体进展某种推断不同点:推断的角度不同参数估计讨论的是用样本统计量估计 总体参数的方法,总体参数卩在估计前是未知的。

而在假设检验中, 那么是先对卩的值提出一个假设,然后利用样本信息去检验这个假设 是否成立2. 什么是假设检验中的显著性程度?统计显著是什么意思?解:显著性程度用a表示,在假设检验中,它的含义是当原假设正确 时却被回绝的概率或风险,即假设检验中犯弃真错误的概率它是由 人们根据检验的要求确定的〔我理解的统计学意义,统计显著是统计上专用的断定标准,指 在一定的概率原那么下,可以成认一种趋势或者合理性到达的程度,到达为统计上程度显著,达不到为统计上程度不显著〕3. 什么是假设检验中的两类错误?解:弃真错误〔a错误〕:当原假设为真时回绝原假设,所犯的错 误成为第I类错误,又称为弃真错误犯第I类错误的概率常记作a取伪错误〔B错误〕:当原假设为假时没有回绝原假设,所犯的 错误称为第II类错误,又称取伪错误犯第II类错误概率常记作B发生第I类错误的概率也常被用于检验结论的可靠性度量假设 检验中犯第I类错误的概率被称为显著性程度,记作a4. 两类错误之间存在什么样的数量关系?在样本容量n 一定的情况下,假设检验不能同时做到犯a和B 两类错误的概率都很小假设减小a错误,就会增大犯B错误的时机; 假设减小B错误,也会增大犯a错误的时机。

要使a和B同时变小只 有增大样本容量但样本容量增加要受人力、经费、时间等很多因素 的限制,无限制增加样本容量就会使抽样调查失去意义因此假设检 验需要慎重考虑对两类错误进展控制的问题5. 解释假设检验中的 P 值 解:假如原假设为真,所得到的样本结果会像实际观测结果那么极端 或更极端的概率,称为P值也称为观察到的显著性程度P值是反映实际观测到的数据与原假设H之间不一致程度的一0个概率值P值越小,说明实际观测到的数据与H之间不一致程度就0越大6・显著性程度与P值有何区别?解:a〔显著性程度〕是一个判断的标准〔当原假设为真,却被回绝 的概率),而P是实际统计量对应分位点的概率值〔当原假设为真时, 所得到的样本观察结果或更极端结果出现的概率〕可以通过a计算置信区间,然后与统计量进展比拟判断,也可以 通过统计量计算对应的 p 值,然后与 a 值比拟判断7・ 假设检验根据的根本原理是什么?解: 假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进展观察,假如样本信息显示出现了与事先假设相反的结果且与原假设差异很大,那么说明原来假定的小概率事件在一 次实验中发生了,这是一个违犯小概率原理的不合理现象,因此有理 由疑心和回绝原假设;否那么不能回绝原假设。

8・ 你认为在单侧检验中原假设和备择假设的方向应该如何确定?解:假设问题有两种情况,一种是所考察的数值越大越好〔左单侧 检验或下限检验〕临界值和回绝域均在左侧;另一种是数值越小越 好〔右单侧检验或上限检验〕临界值和回绝域均在右侧二、练习题1.某炼铁厂的含碳量服从正态分布N (4・55, 0.1082〕如今测定了 9炉铁水,其平均含碳量为4.484假如估计方差没有变化,可否认 为如今消费的铁程度均含碳量为4.55 (a=0・05)?解: uo=4.55,o 2=0.1082, N=9, 2=4.484,这里采用双侧检验,小样本,使用Z统计假定如今消费的铁程度均含碳量与以前无显著差异那么,H卩=4.55 ; Hi:卩工4.55 a =0.05,a /2 =0.025,查表得临界值为卫=1.96 计算检验统计量:Z = x _ 二0 = (4.484-4.55)/(0.108/7 9) a //=-1.833决策:TZ值落入承受域,.••在a=0.05的显著性程度上承受H结论:有证据说明如今消费的铁程度均含碳量与以前没有显著差异,可以认为如今消费的铁程度均含碳量为4.552. 一种元件,要求其使用寿命不得低于700小时。

现从一批这种元件中随机抽取36件,测得其平均寿命为680小时该元件寿命服从正态分布,60小时,试在显著性程度0.05下确定这批元件是否 合格解:N二36,o二60,『二680,卩700这里是大样本,左侧检验,米用Z统计量计算提出假设:假定使用寿命平均不低于700小时H:心7000H :卩 < 7001a = 0.05,左检验临界值为负,查得临界值:-Z005=-1.6450.05计算检验统计量:Z 二 X — ±0 a / /=(680-700)/(60/^36)=-2决策:・・・Z值落入回绝域,.••在a=0.05的显著性程度上回绝H0, 承受H结论:有证据说明这批灯泡的使用寿命低于700小时,为不合 格产品3・某地区小麦的一般消费程度为亩产250公斤,其标准差是30公 斤现用一种化肥进展试验,从25个小区抽样,平均产量为270公 斤这种化肥是否使小麦明显增产]a=0・05)?解:卩250, o = 30, N=25, 2=270这里是小样本分布,用Z统计量右侧检验,a =0.05,那么Z=1.645a提出假设:假定这种化肥没使小麦明显增产即 H : uW2500H : u > 250 1计算统计量:Z = 〔2-打 /〔o/VN〕= 〔270-250〕/〔30/^25〕= 3.33结论:Z统计量落入回绝域,在a =0.05的显著性程度上,回绝H0,承受斗0 1。

决策:有证据说明,这种化肥可以使小麦明显增产4・ 糖厂用自动打包机打包,每包标准重量是100千克每天开工 后需要检验一次打包机工作是否正常某日开工后测得9包重量(单 位:千克)如下略)包重服从正态分布,试检验该日打包机工作是否正常a =0.05) 解:N=9,这里是小样本正态分布,o未知,双侧检验,米用t统计 量,自由度为N-l=8a =0・05,那么T /2=2・37a/2启 99.98E比-g 二] \ ^-1 心1.22提出假设,假设打包机工作正常:即 H : u 二 1000H : u # 1001计算统计量:u0=〔99.98-100〕/〔 1.22/V9〕心-0.049结论:・・・t值落入承受域,.••在a=0.05的显著性程度上承受Ho决策:有证据说明这天的打包机工作正常5.某种大量消费的袋装食品,按规定不得少于250克今从一批该 食品中任意抽取50袋,发现有6袋低于250克假设规定不符合标 准的比例超过5%就不得出厂,问该批食品能否出厂]a=0.051?解:N=50, P=6/50=0.12,为大样本,右侧检验,用Z统计量计算a=0.05,即 Z =1.645aH丌W5%斗:丌>5%z = p=P0 〜N(0,1)(1_ P )0 n 0 = (0.12-0.05)/7 (0.05X0.95三50)心2.26〔因为没有找到丌表示的公式,这里用P0表示丌0〕结论:因为Z值落入回绝域,所以在a=0.05的显著性程度上, 回绝H0,而承受比0 1。

决策:有证据说明该批食品合格率不符合标准,不能出厂6.某厂家在广告中声称,该厂消费的汽车轮胎在正常行驶条件下超过目前的平均程度25000公里对一个由15个轮胎组成的随机样本 做了试验,得到样本均值和标准差分别为27000公里和5000公里假定轮胎寿命服从正态分布,问该厂家的广告是否真实(a=0.05) ?解:N=15, 2 =27000, s=5000,小样本正态分布,o未知,用t统计量计算这里是右侧检验,a=0.05,自由度N-l=14,即t =1.77aHo:^0^25000x —卩Hi:卩 >25000=〔27000-25000〕/〔5000三丿15〕心1.55结论:因为t值落入承受域,所以承受H0,回绝儿决策:有证据说明,该厂家消费的轮胎在正常行驶条件下使用寿 命与目前平均程度25000公里无显著性差异,该厂家广告不真实7.某种电子元件的寿命x〔单位:小时〕服从正态分布现测得16 只元件的寿命如下:〔略〕问是否有理由认为元件的平均寿命显著地 大于225小时(a=0・05)?解:2= 241.5,由于N=16,小样本正态分布,o未知,用t统计量计算这里是右侧分布,a=0.05,自由度N-1=15,即t =1.753aH :卩 W2250 0H :卩 >2251=〔241.5-225〕/ (98.726^716)^0.67结论:因为t值落入承受域,所以承受H0,回绝斗01。

决策:有证据说明,元件平均寿命与225 小时无显著性差异不能认为元件的平均寿命显著地大于225 小时。

下载提示
相关文档
正为您匹配相似的精品文档