应用统计复习题

无***

实名认证

店铺

DOC

116.50KB

约6页

文档ID:157528797

1/6页

点击查看更多>>

文本预览下载提示常见问题

l 主成分分析的目的是什么？（数据的压缩；数据的解释；常被用来寻找判断事物或现象的综合指标，并对综合指标所包含的信息进行适当的解释）l 设p个原始变量为，新的变量(即主成分)为，主成分和原始变量之间的关系表示为?l 在进行主成分分析时是否要对原来的p个指标进行标准化？SPSS软件是否能对数据自动进行标准化？标准化的目的是什么？（标准化的目的是消除变量在水平和量纲上的差异造成的影响）l 根据我国31个省市自治区2006年的6项主要经济指标数据，进行主成分分析，找出主成分并进行适当的解释：（下面是SPSS的输出结果，请根据结果写出结论）表一：数据输入界面表二数据输出界面a）表三数据输出界面b）表四数据输出界面c）表五数据输出界面d）表二至表五，是SPSS的输出表，试解释从每张表可以得出哪些结论， l 设p个原始变量为，要寻找的m个因子(m

变量共同度指该变量的方差（为1）可以由公共因子解释的百分比，公共因子方差贡献率指该因子能解释的方差占全部变量方差的比例，l 因子分析中KMO检验主要检验什么？KMO越接近1，变量间的______越强KMO在____以上，说明该问题适合做因子分析l 因子分析中公因子个数确定的依据是什么？因子分析中因子旋转(factor rotation)的目的是什么？什么是因子得分(factor score)？(特征根大于1或碎石涂上下降速度较快的特征根的数目; 使因子载荷系数向±1或0靠近,实际意义方便解释; l 简述Fisher’s判别的原理建立Fisher判别函数的准则是什么？（Fisher判别，亦称典则判别，是将自变量投影到较低维度的空间，再进行分类相当于将自变量先提取几个主成分，只需根据主成分分类Fisher准则：使得综合指标Z在A类的均数与在B类的均数的差异尽可能大，而两类内综合指标Z的变异尽可能小）l 写出多元回归模型的基本假定（高斯假定）l 解读l 根据我国31个省市自治区2006年的6项主要经济指标数据，进行因子分析，对因子进行命名和解释，并计算因子得分和排序表一数据输入界面：表二因子分析SPSS输出界面a）表三因子分析SPSS输出界面b）表四因子分析SPSS输出界面c）表四因子分析SPSS输出界面d）表五因子分析SPSS输出界面e）试根据上面的SPSS输出表格，解释根据表二至表五的各表可以得出什么结论。

l Q聚类主要针对什么进行分类？R聚类主要针对什么分类？对样本进行聚类分析中，点间距离的计算有多种不同的计算公式，试写出三个不同的距离公式Euclidean距离、Squared Euclidean距离、Block距离、Chebychev距离、Minkovski距离ll 对变量进行聚类分析中，有哪两种测度相似度的方法？（夹角余弦与Pearson相关系数）l 层次聚类法（系统聚类法）计算类间距离有多种方法，试写出两种方法l K-均值聚类是针对样品（CASE）的聚类还是针对变量的聚类？l K-均值聚类是否需要在聚类之前先做标准化处理？l 做聚类分析时，层次聚类法、K-均值聚类法、以及两步聚类法三种方法，应该如何选择聚l 一家大型商业银行在多个地区设有分行，为弄清楚不良贷款形成的原因，抽取了该银行所属的25家分行2002年的有关业务数据试建立不良贷款y与贷款余额x1、累计应收贷款x2、贷款项目个数x3和固定资产投资额x4的线性回归方程，并解释各回归系数的含义上表是计算机输出的结果试写出多元线性回归模型，并进行统计学检验l 在建立回归模型时要避免出现多重共线性(multicollinearity)。

多重共线性是指什么？判断多元回归模型中是否存在多重共线性的判断指标有哪些，它们的判断标准是什么？（要求至少写出两个指标的名称）（容许度小于0.1或0.2，方差膨胀因子大于5或10，特征值接近于零，或条件指数大于30：.）l 建立回归模型时的计量经济学检验主要检验哪些指标？（随机误差项序列存在异方差性；随机误差项序列存在序列相关性；解释变量（自变量）之间存在多重共线性；解释变量与随机误差项有相关性）l 方差分析方法有哪些种类？试解释之l 简述因子分子与主成分分析的区别l 系统聚类和快速聚类的特点分别是什么？l 在聚类分析中，两个样品之间的距离主要有哪些种定义方法？各有什么特点？l 简述判别分析与聚类分析的区别l 例举两种非参数检验方法, 并说明其检验内容l 简述logistic回归的原理和适用条件l 简述多元线性回归中，写出两种多重共线性的诊断方法和解决方案。

下载提示

点击查看常见问题