精品资料1.2 回归分析(二)课时目标 1.会对变量x与y进行相关性检验.2.进一步理解回归分析的基本思想.1.根据给定的样本数据,求得的线性回归方程未必有实际意义.2.对相关系数r进行显著性检验的基本步骤如下:(1)提出统计假设H0:变量x,y________________;(2)如果以95%的把握作出推断,可以根据1-0.95=0.05与n-2在附录1中查出一个r的__________(其中1-0.95=0.05称为____________);(3)计算__________________;(4)作出统计推断:若__________,则否定H0,表明有________的把握认为x与y之间具有__________________;若________,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有__________________.一、填空题1.下列说法正确的是________.(填序号)①y=2x2+1中的x、y是具有相关关系的两个变量②正四面体的体积与其棱长具有相关关系③电脑的销售量与电脑的价格之间是一种确定性的关系④传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量2.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,线性回归方程为 =0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均工资收入的百分比约为________.3.对具有线性相关关系的变量x、y有观测数据(xi,yi) (i=1,2,…,10),它们之间的线性回归方程是=3x+20,若xi=18,则yi=________.4.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得线性回归方程 = x+ 中的 为9.4,据此模型预报广告费用为6万元是销售额为________万元.5.若回归直线的斜率的估计值是1.23,样本的中心点为(4,5),则线性回归方程为________________.6.某种产品的广告费支出x与销售额y之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是__________________________________.x/万元24568y/万元30406050707.根据统计资料,我国能源生产自1986年以来发展很快.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:年份1986199119962001产量8.610.412.916.1根据有关专家预测,到2010年我国能源生产总量将达到21.7亿吨左右,则专家所选择的回归模型是下列的四种模型中的哪一种________.(填序号)① = x+ (a≠0);②y=ax2+bx+c(a≠0);③y=ax(a>0且a≠1);④y=logax(a>0且a≠1).8.下列说法中正确的是________(填序号).①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数;⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.二、解答题9.假设学生在初一和初二数学成绩是线性相关的.若10个学生初一(x)和初二(y)的数学分数如下:x74717268767367706574y76757170767965776272试求初一和初二数学分数间的线性回归方程.10.在某化学实验中,测得如下表所示的6对数据,其中x(单位:min)表示化学反应进行的时间,y(单位:mg)表示未转化物质的质量.x/min123456y/mg39.832.225.420.316.213.3(1)设y与x之间具有关系y=cdx,试根据测量数据估计c和d的值(精确到0.001);(2)估计化学反应进行到10 min时未转化物质的质量(精确到0.1).能力提升11.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下表的统计资料:使用年限x23456维修费用y2.23.85.56.57.0若由资料知y与x呈线性相关关系.(1)试求线性回归方程 = x+ 的回归系数 与常数项 ;(2)估计使用年限为10年时,维修费用是多少?12.测得10对某国父子身高(单位:英寸)如下:父亲身高(x)60626465666768707274儿子身高(y)63.665.26665.566.967.167.468.370.170(1)对变量y与x进行相关性检验;(2)如果y与x之间具有线性相关关系,求线性回归方程;(3)如果父亲的身高为73英寸,估计儿子的身高.1.线性回归方程可得到变量 的估计值.2.通过显著性检验可以推断x、y之间是否具有线性相关关系.1.2 回归分析(二)答案知识梳理2.(1)不具有线性相关关系 (2)临界值r0.05检验水平 (3)样本相关系数r (4)|r|>r0.05 95% 线性相关关系 |r|≤r0.05 线性相关关系作业设计1.④解析 感染的医务人员数不仅受医院收治的病人数的影响,还受防护措施等其他因素的影响.2.83%解析 当 =7.675时,x≈9.262,∴估计该城市人均消费额占人均收入百分比约7.6759.262≈83%.3.254解析 由xi=18,得=1.8.因为点(,)在直线 =3x+20上,则=25.4.所以yi=25.410=254.4.65.5万元解析 由题意可知=3.5,=42,则42=9.43.5+ , =9.1, =9.46+9.1=65.5.5. =1.23x+0.08解析 回归直线 = + x经过样本的中心点(4,5),又 =1.23,所以 =- =5-1.234=0.08,所以线性回归方程为 =1.23x+0.08.6.(6,50) 7.①8.④⑤解析 回归分析就是研究两个事件的相关性;回归模型是需要通过散点图模拟的;回归模型有线性和非线性之分.9.解 因为=71,=50 520,=72.3,iyi=51 467,所以, =≈1.218 2. =72.3-1.218 271=-14.192 2,线性回归方程是: =1.218 2x-14.192 2.10.解 (1)在y=cdx两边取自然对数,令ln y=z,ln c=a,ln d=b,则z=a+bx.由已知数据,得x123456y39.832.225.420.316.213.3z3.6843.4723.2353.0112.7852.588由公式得a≈3.905 5,b≈-0.221 9,则线性回归方程为 =3.905 5-0.221 9x.而ln c=3.905 5,ln d=-0.221 9,故c≈49.681,d≈0.801,所以c、d的估计值分别为49.681,0.801.(2)当x=10时,由(1)所得公式可得y≈5.4(mg).11.解 (1)由已知条件制成下表:i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3x4916253690=4, =5,x=90, xiyi=112.3于是 ===1.23, =- =5-1.234=0.08.(2)由(1)知线性回归方程是 =1.23x+0.08,当x=10时,y=1.2310+0.08=12.38(万元).即估计使用10年时维修费用是12.38万元.12.解 (1)=66.8,=67.01,x=44 794,y=44 941.93, =4 476.27,2=4 462.24,2=4 490.34,xiyi=44 842.4.所以r===≈≈0.9 801.又查表得r0.05=0.632.因为r>r0.05,所以y与x之间具有线性相关关系.(2)设回归方程为 = x+ .由 ===≈0.4645, =- =67.01-0.464 566.8≈35.98.故所求的线性回归方程为 =0.464 5x+35.98.(3)当x=73时, =0.464 573+35.98≈69.9,所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.。