2011—2012学年第二学期《社会统计学与SPSS应用》练习题一、单项选择题1.只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有=与≠的数学属性,例如:性别,民族等变量,该类变量是(A)A.定类变量 B.定序变量 C.定距变量 D.定比变量2.根据上题内容,在操作SPSS软件时,在Measure选项中选择正确的是(B)A.B.C.D.3.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性这说明新生婴儿性别状况属于(D)A.非统计现象 B.统计现象 C.非随机现象 D.随机现象4.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性这体现新生婴儿性别状况具有(D)A.确定性 B.因果性 C.必然性 D.随机性5.为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少年、成年、中年、老年,那么,年龄划分违背了变量取值的 原则B)A.完备 B.互斥 C.整体 D.差异6.下列哪类变量能用折线图表示其分布状况?(C)A.定类变量 B.定序变量 C.定距变量 D.虚拟变量7.下列某变量取值状况的累积图,其中正确的表现形式是(B)。
D.C.B.A. 8.下两图是正态分布密度曲线,两图的σ2相同,图1较之图2的密度曲线向左移了一些,这说明(C)图2图1A.µ1>µ2 B.µ1=µ2 C.µ1<µ2 D.µ1≥µ29.在SPSS软件中,对于多选项分析而言,如下所示首先应该操作步骤的是(C)A. FrequenciesB. DescriptivesC. Define Variables SetsD. Frequencies10.下图所示的若为了测量集中趋势,需要在哪个□前打“√”的是(B)A. QuartilesB.ModeC. VarianceD. Range11.下图包含两条正态分布密度曲线,它们的µ相同,那么上方曲线的σ1与下方曲线σ2的关系是(C)µA. σ1>σ2 B. σ1=σ2 C. σ1<σ2 D. σ1≥σ212.下列哪类分布图形随着自由度k无限增加,逐渐趋于标准正态分布D)A.E分布 B. χ2分布 C. F分布 D.t分布13.在进行区间估计时,置信度与显著性水平之和为(C)。
A. 0 B. -1 C. 1 D. 214.在进行区间估计时,显著性水平为α,置信度为(C)A. 0 B. -α C. 1-α D. 2α15.在拒绝原假设时出现的错误称为(D)A.第二类错误 B.纳伪的错误 C.以假当真错误 D.弃真的错误16.大样本二总体均值差进行统计检验时与单样本均值检验相比,主要区别是(A)A.标准差 B.均值 C.统计量分布 D.临界值17.大样本二总体成数差进行统计检验时与单样本成数检验相比,主要区别是(A)A.标准差 B.均值 C.统计量分布 D.临界值18.如下表所示,求出2×2表中相关强度φ系数为(C)消费状况群体划分市民民工消费场所大型超市3010小型商店1030A. 1 B. 0.3 C. 0.5 D. 0.419.如下表所示,求出该表中同序对的个数为(B)受教育状况父辈大学中学小学子辈大学1063中学8107小学2410A.310 B.624 C.524 D.31420.两个定序变量之间Gamma系数取值范围为(A)。
A. [-1,1] B. [-∞,0] C. [0,+∞] D. [0,1]21.为测量两个定类变量相关系数,需要在下列哪项功能□前打“√”?(A)C.A.D.B.二、填空题1.所有变量值百分比对的集合称作百分比分布,又称变量的频率或相对频次分布2.在制作统计表时,需要对变量取值进行分组,一般分组点比原统计资料的精度要高一位,例如,原统计资料的年龄以年计算,统计范围为1~2岁、3~4岁、5~6岁、7~8岁等分为四组,实际分组为0.5~2.5岁、2.5~4.5岁、4.5~6.5岁、6.5~8.5岁等四组,那么,原统计资料的分组组界称为标明组界3.统计表必须具备的内容有表号、表头、标识行、主体行、表尾等五部分组成,这样才能构成一份完整的统计表4.某村家庭子女数量频次分布:2、3、1、4、2、4、3、2、1、2、0、1、2、3、1、3、2、0、4、2,在家庭子女数量这个变量取值中众值是 2 5.某社区六个家庭人口数量分布:3、4、5、8、9、9在家庭人口数量这个变量取值中中位值是 6.5 6.方差与标准差用来度量定距变量的离散程度的测量方法7.当变量的取值满足了完备性和互不相容性,那么取值和概率对的集合就是随机变量的概率分布。
8.古典法产生于概率论发展的早期,以“在相似的条件下进行无数次实验”的观点来思考问题,以对象本身所具有的对称性而事先得到的,故被称为先验概率9.统计推论的基础是概率论,内容包括两部分:参数估计与假设检验10.从总体中抽取容量为n的样本,可以看作n个独立同总体分布的随机变量ξ1,ξ2,……,ξn,那么,随机变量ξ1,ξ2,……,ξn的任何函数f( ξ1,ξ2,……,ξn )也是随机变量我们把函数f( ξ1,ξ2,……,ξn )叫作统计量11.根据随机变量的观测值X1 , X2 , ……, Xn计算得到的一切统计数字特征(例如均值、方差)可以看作是相应统计量的观测值,统计量的分布又称抽样分布12.原假设(H0)又称虚无假设或解消假设,常常是根据已有的资料,或根据周密考虑后确定的13.备择假设(H1)又称为研究假设,当经过抽样调查,有充分根据否定原有假设时,就产生了需要接受其逻辑对立面的假设14.假设检验的基本原理是小概率原理15.在某个列联表中,只观察其中某一变量的分布,而不管另一个变量的取值,这样就得到边缘分布16.协方差表示两个定距变量观测值相对其各自均值所造成的共同平均偏差17.两个定距变量的相关系数r是度量变量间的线性相关程度的,具有PRE性质,r的平方又称为判定系数有着直观的解释意义。
18.方差分析是研究定类变量与定距变量之间相关关系,主要分析或检验总体间的均值是否有所不同19.方差分析中把被解释掉的误差在总体误差中所占的比率称为相关比率20.非参数检验是指“对分布类型已知的总体进行参数检验”之外的所有检验方法 21.非参数检验方法是指这类方法的使用不需要对总体分布作任何事先的假定,也不是检验总体分布的某些参数,而是检验总体某类有关的性质三、判断题(根据题意,表述正确的在后面括号内打“√”,表述错误的在后面括号内打“×”)1.在选用社会统计分析方法时,需要注意区分研究的是单变量还是多变量,前者往往分析存在的关系及其强度,后者分析变量的集中或离散的特征情况×)2.在绘制统计表时,对于定序变量而言需要注意次序排列、变化趋势√)3.直方图可以用来反映定类变量的取值状况×)4.直方图与条形图形状相同,没有什么本质区别×)5.中位值比较适用于定距变量×)6.某个变量取值呈正态分布,它的众值、中位值重叠,与均值不重叠×)7.某个变量取值呈正态分布,它的众值、均值重叠,与中位值不重叠×)8.统计推论是根据局部资料(样本资料)对总体的特征进行推断√)9.“抽样结果与总体参数不一致”是随机现象在推论中所特有的。
√)10.总体分布为正态分布N(µ,σ2),且方差已知,随着样本容量n的增加,也不能减少样本均值抽样分布的分散程度×)11.若总体分布为正态分布,且方差已知,样本均值分布服从t分布×)12.若总体分布为正态分布,大样本均值的极限分布不是N(0,1)×)13.在区间估计中,置信度表示用置信区间估计的可靠性√)14.在区间估计中,显著性水平表示用置信区间估计不可靠的概率√)15.大样本二总体均值差的分布不服从正态分布×)16.大样本二总体成数差的分布不服从正态分布×)17.两个定类变量之间以χ2为基础的相关性测量得到C系数具有减少误差比例性质×)18.两个定类变量之间相关性测量得到λ系数不具有减少误差比例性质×)19.Gamma等级相关的G系数具有减少误差比例的性质20.斯皮尔曼等级相关系数rs具有减少误差比例的性质四、计算题(要求步骤完整,计算结果正确)1.根据下表2008年某班级Q课程成绩统计分布情况,求某班级Q课程成绩的中位值2008年某班级Q课程成绩统计分布情况成绩等级频次累计频次不及格33及格1215中1833良好2255优秀5602.根据下表某城市抽样调查家庭月收入统计分布情况,求该市家庭月收入的中位值。
某城市抽样调查家庭月收入统计分布情况家庭月收入 频次 累计频次(cf↑) 累计百分比(%) 500及以下 10 10 10 500—1000 20 30 30 1000—2000 35 65 65 2000—3000 25 90 90 3000及以上 10 100 100 3.下列统计表反映是抽取两个社区部分居民受教育年限的统计分布状况:社区类别抽样数量(个)受教育年限分布状况(年)A57、3、11、10、4B66、5、5、8、10、8根据抽样数据,求出两个社区的平均受教育年限各是多少?相同吗?4.某系大学一年级共550人,Z课程期末考试成绩统计如下表,求该课程的平均分数是多少?某系大学一年级Z课程期末考试成绩统计分布状况分数学生数量50156028634070290741608017总和5505.针对某村返乡人口状况进行调查,抽取11户大型联合家庭进行调查,各自家庭返乡人口数量分别为:2、2、3、4、4、4、5、5、6、6、7求样本中返乡人口数量的四分互差是多少?答案:Q=36.为了解某种新型奶制品的消费者偏好状况,访问了80个消费者,其中,选择喜欢的有25个,选择一般的有30个,选择不喜欢的有20个,选择无所谓的有5个。
求反映偏好状况的四分互差是什么?答案:有50%的消费者在喜欢与不喜欢之间7.设某工厂妇女从事家务劳动时间服从正态分布N(µ,0.662)根据36人的随机抽样调查,每天平均从事家务劳动时间为2.65小时,求µ的双侧置信区间(置信度0.95,Zα/2=1.96,保留小数点后两位)答案:[2.44,2.87]8.为了对某工厂职工休闲时间进行研究根据一次样本(n=33)的调查,平均每天看电视时间为: =0.96小时,S=0.47,试求全厂职工平均每天看电视时间的区间估计(置信度为95%)假定看电视时间服从正态分布N(µ,σ2),其中σ2未知解析:只知道总体的分布状况而不知道方差,只是样本均值分布服从t分布,需要查表,并且要注意t分布是对称分布 查表:t α/2=2.0369≈2.04 t α/2=±2.04答案:[0.79,1.13]9.设某社区受教育程度服从正态分布N(µ,3.62),根据25人的随机调查,平均受教育年限均值为11.5年,求µ的双侧置信区间(1-α=0.99,Zα/2=2.58,保留小数点后两位)[9.64,13.36]10.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有 =871元,S=21元,问能否证明统计报表中人均收入µ=880元是正确的(显著性水平α=0.05,Zα/2=±1.96) 分析与解析步骤: (一)原假设H0 :µ=µ0 =880(二)备择假设H1: µ≠µ0≠880 (三)统计量与拒绝域:根据显著性水平α=0.05,查表拒绝域临界值:Zα/2=±1.96(四)判断: Z=-3.03<-1.96,拒绝原假设,即根据抽样调查不能认为人均收入为880元,统计报表是有误的。
11.某地区成年人中吸烟者占75%,经过戒烟宣传之后,进行抽样调查,发现100名被调查的成年人中,有63人是吸烟者问戒烟宣传是否收到了成效?(α=0.05,Zα=-1.96)解析步骤: (一)原假设H0 :p=p0 =0.75(二)备择假设H1:p<p0= 0.75(三)统计量与拒绝域:根据显著性水平α=0.05,查表拒绝域临界值:Z=-1.96(四)判断: Z=-2.77<-1.96,否定原假设,即认为戒烟宣传是有成效的,吸烟比例有所下降 12.已知初婚年龄服从正态分布,根据9个人的抽样调查有: =23.5岁,S=3岁,问是否可以认为该地区平均初婚年龄已超过20岁(α =0.05)?解:原假设H0 :µ=20岁 备择假设H1: 单边µ>20岁 统计量 查表自由度为8, α =0.05 ,t临界值为1.86,小于3.5,所以拒绝原假设,认为平均初婚年龄超过了20岁 13.就近上学(表示为A)与乘车上学(表示为B)对学习影响,抽样结果如下: 问两者学习成绩是否有差别,如果有,哪种方式更好些?(α =0.05) 解:(1)原假设H0 :µA-µB =0备择假设H1: µA-µB ≠0(2)统计量 (3)拒绝域 查表α =0.05,Z α/2=1.96,小于7.04,所以,认为有差别,而且就近入学要好。
14.以下表中是5对子代和父代之间年收入状况的抽样调查,求两者回归直线方程代际差别年收入状况(万元)父代246810子代45879解析过程:15.以下表中是5对子代和父代之间人际网络(好朋友数量)的抽样调查,求两者回归直线方程代际差别好朋友数量(个)父代246810子代45879解析过程: 16.求下列表的λ系数与τ系数(α=0.05) (1)检验相关;(2)求λ系数;(3)τ系数表4-3:某地区男女工作经历状况(单位:个)不同状况男女共计无“跳槽”经历30120150有“跳槽”经历302050共计60140200答案:检验两者之间存在相关17.为了解学生活动能力与智商间是否有关,作了10名学生的抽样调查,结果如下:学生活动能力名次智商A1110B2110C3105D495E5120FJ694G7100H8105I9105J10110问:学生活动能力与智商是否有显著差异(α=0.05)?答案:无显著性差异,0.54<2.30解答思路:参见320~321页例2,首先对智商进行排序,相同智商名次求取平均名次,然后按照以下步骤:(1)原假设:ρ0=0或变量是相互独立的,备择假设(2)统计量:(3)临界值确定,做出判断。