文档详情

格拉布斯法检验法

ba****u6
实名认证
店铺
DOCX
13.61KB
约5页
文档ID:157771972
格拉布斯法检验法_第1页
1/5

格拉布斯法(Grubbs)检验法▲概述:一组测量数据中,如果个别数据偏离平均值很远,那么这个(这些)数据 称作“可疑值”如果用统计方法一例如格拉布斯(Grubbs)法判断,能将“可疑 值”从此组测量数据中剔除而不参与平均值的计算,那么该“可疑值”就称作“异 常值(粗大误差)”本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”▲测量数据:例如测量10次©=10),获得以下数据:8.2、5.4、14.0、7.3、4.7、 9.0、6.5、10.1、7.7、6.0▲排列数据:将上述测量数据按从小到大的顺序排列,得到4.7、5.4、6.0、6.5、 7.3、7.7、8.2、9.0、10.1、14.0可以肯定,可疑值不是最小值就是最大值▲计算平均值x-和标准差s: *一=7.89;标准差s=2.704计算时,必须将所有10 个数据全部包含在内 s =芒 3 —无)2\ n -1▲计算偏离值:平均值与最小值之差为7.89—4.7=3.19 ;最大值与平均值之差为 14.0—7.89=6.11▲确定一个可疑值:比较起来,最大值与平均值之差6.11大于平均值与最小值 之差3.19,因此认为最大值14.0是可疑值。

▲计算G值:G = (x.—x-)/s;其中i是可疑值的排列序号 1 i i——10 号;因此 Gio=(xio—x-)/s=(14.0—7.89)/2.704=2.260由于 X10—X-是残差, 而,是标准差,因而可认为°是残差与标准差的比值下面要把计算值G1与格 拉布斯表给出的临界值Gp(n)比较,如果计算的Gj值大于表中的临界值Gp(n), 则能判断该测量数据是异常值,可以剔除但是要提醒,临界值Gp(n)与两个参 数有关:检出水平a (与置信概率P有关)和测量次数口(与自由度f有关)▲定检出水平a:如果要求严格,检出水平河以定得小一些,例如定a=0.01, 那么置信概率P=1 — a=0.99;如果要求不严格,河以定得大一些,例如定叫= 0.10,即 P=0.90;通常定a=0.05, P=0.95▲查格拉布斯表获得临界值:根据选定的P值(此处为0.95)和测量次数以此处为 10),查格拉布斯表,横竖相交得临界值 气(10)=2.176▲比较计算值 g和临界值 G95(10): G1=2.260, G95(10)=2.176, Gi>G95(10)o▲判断是否为异常值:因为G>G95(10),可以判断测量值14.0为异常值,将它 从10个测量数据中剔除。

▲余下数据考虑:剩余的9个数据再按以上步骤计算,如果计算的G>G95(9), 仍然是异常值,剔除;如果Gi

实际的测量只不过是从该无限大总体中随机抽取一个容量为例如n=10)的样 本这种样本也可以有无数个,每个样本相当于总体所含测量数据的不同随机组 合样本中的正常值应当来自该总体通常的目的是用样本的统计量来估计总体 参量总体一般假设为正态分布■异常值区分:样本中的正常值应当属于同一总体;而异常值有两种情况:第一 种情况异常值不属于该总体,抽样抽错了,从另外一个总体抽出一个(一些)数据, 其值与总体平均值相差较大;第二种情况异常值虽属于该总体,但可能是该总体 固有随机变异性的极端表现,比如说超过3a的数据,出现的概率很小用统计 判断方法就是将异常值找出来,舍去■犯错误1:将本来不属于该总体的、第一种情况的异常值判断出来舍去,不会 犯错误;将本来属于该总体的、出现的概率小的、第二种情况的异常值判断出来 舍去,就会犯错误■犯错误2:还有一种情况,不属于该总体但数值又和该总体平均值接近的数据 被抽样抽出来,统计检验方法判断不出它是异常值,就会犯另外一种错误■异常值检验法:判断异常值的统计检验法有很多种,例如格拉布斯法、狄克逊 法(Q法)、偏度-峰度法、拉依达法、奈尔法等等每种方法都有其适用范围 和优缺点。

■格拉布斯法最佳:每种统计检验法都会犯犯错误1和错误2但是有人做过统 计,在所有方法中,格拉布斯法犯这两种错误的概率最小,所以推荐使用格拉布 斯法■多种方法结合使用:为了减少犯错误的概率,可以将3种以上统计检验法结合 使用,根据多数方法的判断结果,确定可疑值是否为异常值■异常值来源:测量仪器不正常,测量环境偏离正常值较大,计算机出错,看错, 读错,抄错,算错,转移错误如有侵权请联系告知删除,感谢你们的配合!。

下载提示
相关文档
正为您匹配相似的精品文档