文档详情

应用统计复习题

无***
实名认证
店铺
DOC
116.50KB
约6页
文档ID:157528797
应用统计复习题_第1页
1/6

l 主成分分析的目的是什么?(数据的压缩;数据的解释;常被用来寻找判断事物或现象的综合指标,并对综合指标所包含的信息进行适当的解释)l 设p个原始变量为 ,新的变量(即主成分)为 , 主成分和原始变量之间的关系表示为?l 在进行主成分分析时是否要对原来的p个指标进行标准化?SPSS软件是否能对数据自动进行标准化?标准化的目的是什么?(标准化的目的是消除变量在水平和量纲上的差异造成的影响)l 根据我国31个省市自治区2006年的6项主要经济指标数据,进行主成分分析,找出主成分并进行适当的解释:(下面是SPSS的输出结果,请根据结果写出结论)表一:数据输入界面表二数据输出界面a)表三数据输出界面b)表四数据输出界面c)表五数据输出界面d)表二至表五,是SPSS的输出表,试解释从每张表可以得出哪些结论, l 设p个原始变量为 ,要寻找的m个因子(m

变量共同度指该变量的方差(为1)可以由公共因子解释的百分比,公共因子方差贡献率指该因子能解释的方差占全部变量方差的比例,l 因子分析中KMO检验主要检验什么?KMO越接近1,变量间的______越强KMO在____以上,说明该问题适合做因子分析l 因子分析中公因子个数确定的依据是什么?因子分析中因子旋转(factor rotation)的目的是什么?什么是因子得分(factor score)?(特征根大于1或碎石涂上下降速度较快的特征根的数目; 使因子载荷系数向±1或0靠近,实际意义方便解释; l 简述Fisher’s判别的原理建立Fisher判别函数的准则是什么?(Fisher判别,亦称典则判别,是将自变量投影到较低维度的空间,再进行分类相当于将自变量先提取几个主成分,只需根据主成分分类Fisher准则:使得综合指标Z在A类的均数与在B类的均数 的差异尽可能大,而两类内综合指标Z的变异尽可能小)l 写出多元回归模型的基本假定(高斯假定)l 解读l 根据我国31个省市自治区2006年的6项主要经济指标数据,进行因子分析,对因子进行命名和解释,并计算因子得分和排序表一数据输入界面:表二因子分析SPSS输出界面a)表三因子分析SPSS输出界面b)表四因子分析SPSS输出界面c)表四因子分析SPSS输出界面d)表五因子分析SPSS输出界面e)试根据上面的SPSS输出表格,解释根据表二至表五的各表可以得出什么结论。

l Q聚类主要针对什么进行分类?R聚类主要针对什么分类?对样本进行聚类分析中,点间距离的计算有多种不同的计算公式,试写出三个不同的距离公式Euclidean距离、Squared Euclidean距离、Block距离、Chebychev距离、Minkovski距离ll 对变量进行聚类分析中,有哪两种测度相似度的方法?(夹角余弦与Pearson相关系数)l 层次聚类法(系统聚类法)计算类间距离有多种方法,试写出两种方法l K-均值聚类是针对样品(CASE)的聚类还是针对变量的聚类?l K-均值聚类是否需要在聚类之前先做标准化处理?l 做聚类分析时,层次聚类法、K-均值聚类法、以及两步聚类法三种方法,应该如何选择聚l 一家大型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,抽取了该银行所属的25家分行2002年的有关业务数据试建立不良贷款y与贷款余额x1、累计应收贷款x2、贷款项目个数x3和固定资产投资额x4的线性回归方程,并解释各回归系数的含义 上表是计算机输出的结果试写出多元线性回归模型,并进行统计学检验l 在建立回归模型时要避免出现多重共线性(multicollinearity)。

多重共线性是指什么?判断多元回归模型中是否存在多重共线性的判断指标有哪些,它们的判断标准是什么?(要求至少写出两个指标的名称)(容许度小于0.1或0.2,方差膨胀因子大于5或10,特征值接近于零,或条件指数大于30:.)l 建立回归模型时的计量经济学检验主要检验哪些指标?(随机误差项序列存在异方差性;随机误差项序列存在序列相关性;解释变量(自变量)之间存在多重共线性;解释变量与随机误差项有相关性)l 方差分析方法有哪些种类?试解释之l 简述因子分子与主成分分析的区别l 系统聚类和快速聚类的特点分别是什么?l 在聚类分析中,两个样品之间的距离主要有哪些种定义方法?各有什么特点?l 简述判别分析与聚类分析的区别l 例举两种非参数检验方法, 并说明其检验内容l 简述logistic回归的原理和适用条件l 简述多元线性回归中,写出两种多重共线性的诊断方法和解决方案。

下载提示
相关文档
正为您匹配相似的精品文档