文档详情

大家都来话统计

daj****de2
实名认证
店铺
DOCX
29.44KB
约12页
文档ID:187182122
大家都来话统计_第1页
1/12

大家都来话统计注:本文是为中国人民大学统计学院本科院刊所写的稿件走过了四年本 科,觉得应该对后来人讲一些负责人的话,以使大家能更高效地学习我认为人 生的奋斗,怕的不是没有动力,而是有动力却不知道方向因此,我把我所了解 的统计学的领域介绍给大家,让大家早日了解一下统计学的基本内容,早日找到 自己的方向当然,仅仅四年的学习,得出的观点或多或少会浅薄,所以也请各 位大师多多指点批评统计学的领域——写给在统计学院学习的学弟学妹如果学了几年统计,还连统计的那个经典定义都背不出就不应该了,在此我 不再啰嗦一遍统计学也不是什么神秘的学科,它的目的主要是通过数据探索信 息,因此也就相应有一系列的流程:收集、整理、分析和表述(数据)按照这个流程,统计下属的众多学科的地位与作用也就一目了然今日我取 标题为“统计学的领域”,说实话这个题目有些狂妄够资格写这种题目的人,恐 怕至少应该在统计学界混过数十载不幸的是,本人一向提倡“人不猖狂枉少年”如果没有足够的热情和斗志, 是不可能取得一番成就的正值青春年少,安能不立鸿鹄之志?此为题外话1、收集数据一般来说,数据的来源无非是试验和调查平时我们谈统计学似乎不太注重 数据的收集问题,然而试验设计和调查技术(包括抽样等)都是很有用的学问。

就我们这种纯粹的统计学院来说,试验设计的地位似乎不太高,而我所了解的生 物统计、医学统计等领域对它的要求却特别高,有志于生物医学统计方向的同学 一定要注意研究这门课,有些名词诸如正交设计、随机区组试验、拉丁方试验等 都是你们将来会遇见的,方差分析一般则是试验设计之后最基本的统计分析方 法;对于调查,一方面它是由统计学的理论作背景支撑的(大数定律、数理统计、 抽样理论等),另一方面涉及到实务操作方面的技术,做过调查的同学应该都了 解调查的“艰辛”,当然如果有统计学的指导,我们也会发现一些让人变聪明的技 术,举个例子,对于吸毒问题,受众(调查客体)一般都会低报(不愿意告诉访 员自己吸毒),对于这种情况我们该怎么处理?暂且把悬念留在这里;如果事先 不知道答案,恐怕是很难想象这件事情与抛硬币有任何瓜葛的对于我们这个统计学院(素以经济统计强势著称),从收集数据角度来说, 国民经济核算与经济社会统计也是两门比较重要的课程,搞经济统计不能不对于 经济数据的来龙去脉了如指掌,要不然统计指标都是从何计算而来有何意义都搞 不清楚,还从何谈起经济统计?2、整理数据数据不是说收集上来就可以马上作分析,有实践经验的人都知道,在收集数 据的过程中,总会有各种意想不到的情况发生,但也是天要下雨娘要嫁人没办法 的事情,你总不能把那些在问卷上偷懒空着不填或者乱填一气的同志们抓来严刑 拷打。

在此我有必要提醒各位,一定要做好心理准备,无论你们在学校里老师教 授给你们多完美的理论,到现实中往往会四处碰壁的空着调查项目不填写的我 们称之为缺失值(Missing Value),胡乱填写的可能成为离群点或野值(Outlier) 对于这样的数据,我们应该事先做一些处理才能进行下一步的统计分析,不然会 对统计结果产生一些不良影响,这些道理用脚趾头想想就能明白(都用不着用膝 盖想)当然数据的整理还包括很多其它内容,诸如重新编码(Recode)或者 进行某种综合计算等等,这里不详谈,因为都是很陈旧的内容了我想把我所知 道的统计学中比较近代的技术介绍给大家,让大家对我们的前沿知识有所了解 关于缺失值的处理,目前已经发展起来比较完备的插补技术(Imputation),这 里面包括均值插补、热平台插补、冷平台插补、最近邻插补、EM算法、Bootstrap> Jackknife、MCMC(Monte-Carlo Markov Chain)等知识相信如果大家看看 近代现代统计学的发展,这些名词一定不会陌生对于数据中的离群点,也要先 思考一下,不要轻易删除,一个穷山村中冒出一个大富翁的可能性不一定就是0, 在离群点中反而有可能隐藏对我们有启发的信息(比如一位同学的学分绩太高以 至于成了“野值”,我们就不能把他/她从班里“删除”,而应该借鉴学习经验)。

3、分析数据不可否认,当今社会对于统计的需求,大部分都在于这一块数理统计的纸 老虎会让很多数学功底不好的同志望而却步,再加上统计中众多术语如P值、 置信区间、卡方统计量等又会让很多人觉得费解(曾经有一次我给一位同志解释 了好半天X与Y两个变量的相关系数对方死活就不明白,我疯了),如果再来 一些稍微前沿一些的统计分析方法例如结构方程模型什么的,他们更是会云里雾 里找不着北,然而来自统计分析的打击似乎是无穷尽的,他们最后发现统计软件 也不太会用,要花很多钱购买,更可怕的还都是英文的......我琢磨着,他们一定 心想,苍天呐,如果还有来生,我......一定要学统计......作为统计人也不要太得意,首先统计分析方法你不一定会用,其次即使你会 用也未必能用对地方这个领域我几乎已经无法介绍,因为数百年的发展,让统 计方法扩充得让人很难概括全面了最简单的分类莫过于描述统计与推断统计了 (事实上按照C. R. Rao书中写的,还应该包括探索性统计分析);描述统计大 家应该都懂,数据是什么就是什么,在原始数据的基础上稍作加工,提炼一下信 息,让人对一个数据集(样本)在心中有一个大致的了解,比如一国的GDP, 国家统计局不可能每年都向人民群众公布张三家的鸡下蛋买了多少钱以及某红 星工厂钢铁年产值多少钱,等等,而是公布一个总数,让大家对我国的国力有大 致的了解;推断统计就需要用到一些比较精深的统计理论了,最重要的支撑莫过 于数理统计,所以这门课大家也一定要学好,要知道相比起数学系的数学课,数 理统计根本就没什么难度。

推断统计中,根据是否需要对分布作假设又可以分为 参数统计和非参数统计,后者出现的年代要晚,因此在理论和应用方面可能不如 前者,二者的比较又足以写一大篇文章,此处作罢,但是无论如何,从参数统计 到非参数统计,你的统计思维必将经历一个重大转变,如果学得够深入,你甚至 可以由此联想人生得失问题;不是和大家开玩笑,有时候统计确实能为我们展现 一种人生观相关的名词恐怕也不是一两页纸能列举完的:相关分析(包括典型相关分 析)、回归分析(包括投影寻踪回归、分位数回归)、对应分析、信度分析、生 存分析、聚类分析、判别分析、因子分析、路径分析和主成分分析等如果你全 今还只知道普通最小二乘法(OLS)而不知道偏最小二乘法(PLS)这样的名词, 那只能说明你还在一个古董世界徘徊,需要加把劲了关于数据分析方法,当然首先要打好基础,掌握那些基本方法,若想在方法 领域有所造诣,那么请回家把概率论与数理统计多翻几遍,然后开始啃国外的教 材以及文章我常常遇到这种情况,就是一种方法,我看国外最早的论文是二十 世纪六七十年代的,而国内最早的论文则往往已经是二十一世纪了可以看出, 国内在方法上的研究与国外的差距有多大聪明人会从这里发现一个“市场”,我 就不诱导大家了,这对于国内统计学的长远发展不太有利。

还有一点,也是要提醒大家切记,统计分析方法往往都有理论假设或前提 在实际应用时,务必务必要注意!首先要检查数据是否满足我们的理论条件,不 要拿来就作分析,即使统计软件会“不假思索”地给你输出漂亮的结果统计软 件有时候挺害人的,不要完全相信它们)、表述数据我认为世上不存在不懒的人,因此数据的表述一定也是一门学问你要是把 统计软件输出的P值活生生拿给别人看,八成会被殴;你要是胆敢告诉人家聚 类分析碎石图上石头的位置表示特征根的大小,被扁的概率将一致趋近于1统计是用来说明问题的,不是用来吓唬人的把我们的分析结果表述给人家 看,就需要经过一定的“转化”不要轻视数据的表述问题,有些统计方法之所以 能“红”起来,就是因为人们为它的分析结果找到了巧妙的解释上面说的是统计学方面的表述,外观形式方面的问题同样应该注意表格中 的数据不使用右对齐(或小数点对齐)、图形画得花里胡哨或土里土气,都会让 统计的功效受损,虽然只是“面子问题”学了那么长时间的统计,不应该不知道 图的标题应该写在图下方而表的标题应该写在表上方,平时看文章多注意别人是 怎样表达的好了,统计学本身就从流程上介绍到这里稍微再谈谈我所见到的统计学发 展趋势:一方面是学科结合的趋势,单单只会一门统计学恐已难以立足,统计学 的发展动力,越来越多地来自于其它各个学科,若不是这些学科给统计学“出难 题”,统计学的发展可能早已经停止了,医学会问你,怎样设计试验既能得出显 著的统计结果又能节约成本?心理学会问你,人的情商是一个隐变量,应该怎样 测量?金融学会问你,股票市场上时序数据的异方差怎样处理?市场营销学会问 你,怎样从超市的海量数据中挖掘出有用的商品信息?法学会问你,某甲杀人的 概率有多大?新闻传播学会问你,大众对某位候选者的真实支持率有多高?等 等......;另一方面是计算机的广泛应用趋势,我也要特别强调,计算机在未来的 统计中必将扮演越来越重要的角色,想要摇着笔杆子去追赶奔四3.2绝对是不可 能了,计算机方面又尤其要数编程能力最重要,这番话是对那些想冲到统计时代 前沿的同学们说的,统计方法的发展太快,以至于很多统计软件都跟不上,因此, 若自己掌握计算机编程技术的话就能不必受到统计软件的制约。

我在中国人民大学统计学院已经学习了四年,感触颇多,牢骚也不少生活 方面不多说,大家最好早点学会自强自立,早已经过了 18岁,有空听听郑智化 的《水手》学习方面说这样几点吧:首先,不要指望你的老师会教给你所有的知识,同时也要明白你所学的知识 是很不全面的大学与高中不一样,这里不是一个纯粹的教学的地方,更多地是 思想碰撞交流的地方如果到现在你还在上课时埋头认真地把老师说的每一个字 记下来,那么你可能还没理解什么叫大学统计学纷繁芜杂的体系,不是老师在 几节课上能讲出来的老师可以告诉你,统计学都有什么内容,剩下的就是你自 己多多努力奋斗其次,攻书莫畏难可能这也是大学与高中的区别之一,高中某一道题不会 做可能会影响你的考试成绩,而大学则不是用来为难人的地方此路不通可以走 彼路,你若不擅长积分,那么对于书中证明用到积分的地方大可不必仔细看,总 之要有自己擅长的地方,然后注意培养自己的优势,以最快的速度向前发展不 过话说回来,不要被我误导,我不是说可以随意放弃一些课程,基础仍然是要打 好的,在这个条件下,你可以选择自己擅长的方向发展再次,不要忽视图书馆的丰富资源,不仅包括图书,而且还有大量电子资源 注意上网看看,学校都购买了大量的论文数据库,不用实在可惜了。

里面的统计 刊物可以趁早接触一些,对于论文写作以及知识面的拓展是很有好处的最后,不要惧怕高年级的学长们,他们都知道吃人是犯法的,因此大可放心 去请教、取经,让自己少走一些弯路只可惜,当年没有学长对我这样说,以全 于我一直惧怕学长会吃了我......还有,一定要用好英语我可没告诉你们要考好英语)以及,不要没日没夜地上自习当然也别像我从不上自习)对了,上网别总聊,以后发财了有的是时间聊,现在有空多来我们的“统 计之都”网站看看:http://www.cos.name一死生为虚诞,齐彭殇为妄作各位加油对统计学的一知半解常常造成不必要的上当受骗;对统计学的一概排斥常常 造成不必要的愚昧无知一一C.R.Rao在日常生活中,我们常常根据不确定的信息做出选择例如一男一女在餐厅 点菜,女人可能会想:“我以前从来没有和别人一起出来吃饭,还不清楚谁买单 呢,这个汤便宜一些,今天我点这个汤吧男的可能会想:“这个汤今天不知道 味道如何,但以前在这里吃过36次饭,27次点过这个汤,味道不错,今天我还 是点这个汤吧我们多数人对生活中的不确定性泰然处之,但统计学的独特之处在于,它能 对不确定性进行量化,使其精确为此统计学家需要对不确定的程度进行非常准 确的陈述,例如:我有95%的把握确信,今晚汤好喝的概率在73%到77%之间。

为了实现量化的过程,统计学家求助于相互联系的三方面知识:(1) 数据收集:用实验或者调查的方法收集、整理、汇总数据2) 概率:赌场内外研究不确定性的法宝之一3) 推断:运用概率知识从一定的数据中得出统计结论联系上述的三个方面,产生了统计学的学科框架:描述统计:研究数据的整理、展示和初步分析概率论与数理统计:运用随机变量的概念,通过概率模型,描述客观真理抽样调查:统计学家从总体中选取样本的方法统计推断:在大千世界中运用统计学解决诸如民意测验、产品质量控制、医 学检验、环境监控、法律等各方面的难题总之,统计学无处不在注:作者谢邦昌老师系辅仁大学统计信息学系教授、中华资料采矿协会理事长, 本站已经获得谢老师的许可发布本文于此,未经许可请勿转载!统计的出世与入世装饰了这么漂亮的题目,可能只是这一、二年来自己心中的牢骚,或许也可 将之视为统计人的心灵改革促成此题目最大的动机是希望能提振统计的风气, 因为无论是院处、省府或县市,有许多同仁私下与我聊天时皆认为现下统计的气 氛日益低迷,甚至在学校也经常面临学生的质疑,他们怀疑统计的价值,对统计 在社会中扮演的角色与发挥的功能无法产生认同感相信一些和我一样从事统计 研究的先进在看待这些问题时也有相同的看法,希望能够有认同我们的人并且在 这共识间共同持续地努力。

任何领域最重要的就是每一个参与的人对此领域的关心,我经常讲一句很臭 屁的话 「when you analyse any topic, you are involved in statistics. J, 自从在 很多场合发表过这句话后,至少还没有人认为我在”澎风”事实上亦是如此,在 许多领域中会发觉需要统计,统计在许多领域中皆扮演举足轻重的角色当然并 非没有统计就无法运作,但有了统计加入,可以做出更好、更精致的决策因此 统计是无所不在的我本身所学为生物统计,当初一进农学院,老师就告诉我们 一句话「when you eat, you are involved in agriculture. J,你只要想到吃,你就 在所有农业范围里相对的,只要想到任何领域中的任何分析、任何主题,就应 该involved到统计的领域里面因此今天并非统计没落,而是因为大家都懂统 计,很多人都认为他会统计,这时统计的专业人员应抱持什么态度呢?绝不是人 人都懂统计,就觉得统计不重要,相反的应该更重视统计,认定统计日益重要 这是我最初步的观点在此引用韦主计长的一些论点,主计长曾有一篇「从管子问篇论整个国政」, 他所写的社会指标第一章的指标管理就提到从古到今统计对国政的重要性,汉、 唐之兴盛奠基于秦、隋两朝代健全的统计制度,若没有秦跟隋健全的统计制度, 汉唐盛世无法延续如此之久,所以基本上从历史的角度来看统计的重要是有其道 理的。

另外先提一下统计的本质一机率性,好比我想去一个地方,不巧碰上塞车, 在路上我心理就会想有哪些替换道路,一个简单的统计观念在我脑中形成,也许 我会将路线图量化,然后去选择可能最快的路像这样简单的思考过程其实就是 统计的应用有句话蛮有道理的,「卫青不败由天幸,李广无功缘数奇」,历代有 人成功也有人失败,其实不必喟叹些什么,只因为大家都活在统计里,面对的是 一连串的机率过程是否统计便无法精确呢?其实就像我常说的,除了完全错误 外,大概接近对就行了,所以会有什么funny theory,大概对就好了但是并非 要每个人去当差不多先生,而是因为统计所追求的并不是完全的精确,而是寻求 一个合理的精确范围,这是统计很符合人性的特质,学统计的人都知道这个道理, 主计长亦是抱持这个观点管子曾说「不明于数欲举大事,如舟之无楫而欲行于大海也」意思是说在 不清楚相关数据的情况下想做大事,无疑是没有桨的船想航行于江洋大海中一 样例如政府想扑杀野狗,如果没有野狗分布的数据,不知道野狗形成的来龙去 脉,怎么去执行?如何能下决策?再比方先前口蹄疫事件,原先说是一千亿,后 来又说是二千亿,最后到四千亿!什么数据都出笼,类似这种情形,便可明白统 计的重要。

现在有另一种声音,认为统计与信息差不多,统计可以停掉了,并到 信息里就行了并并看吧!并在一起就更知道统计的重要了实际上信息能处理 的还是有限,现在各院处都在推动统计数据库,或首长信息系统,这些东西都着 眼于统计与信息的结合,而非将统计并入信息统计在这个时代所扮演的角色应 该是与信息相结合,根据主计长的看法是统计方法的工具观,因为统计是一个很 重要的工具,它可以发现问题所在,相当符合现在的类神经网络的观念,透过反 复学习与反复的除错,马上再更正除错所遇到的问题,进而以简驭繁,显示出一 个大概的趋势我们经常在求线性模式,虽然很多现象并非线性,但是线性的概 念可以马上显示出大概的趋势,知道趋势后,能掌握住这个趋势就不错了,不一 定非得掌握住每一个脉动,这就是统计以简驭繁的功能,然后再求新求变,研究 下一步的方向,主计长便是把这种统计观念放在他处理预算的工作上现在统计人常感觉士气很低落,认为统计会被并掉,很多单位要裁就先裁统 计人员;在学校学生学统计常觉得没有什么出路,不知道毕业后能做什么?主计 长很喜欢「战火浮生录」中的一段话,希望我们能等到他创一个统计的新局面, 无论是国家统计局或其它统计方面找出一个较精确的出路,如果看过战火浮生录 就知道,其实这段话蛮美的也蛮适切的,将这段话一『如果女尔等我,我一定会回来!但女尔要认真的等,全心全意的等!等到天下 黄雨,等到天飘白雪!等到女尔心意动摇,记忆空白。

等到所有的等待,都已静止....., 我一定会回来!』再配合美丽的背景,是相当美的境界你会很甘心的等,等主计长创造历史, 也就是我们必须先回过头来面对现实,这就是我想说的「统计的出世及入世观」首先可以确定的是大家都认为统计很重要,这不是我说的,很多人都这么认 为,很多人需要统计,无论在学校、机关或业界,无论是县市或各厅处,只要有 需要我帮忙的,我一定非常乐意帮忙,因为这是我最大的资源,什么资源呢?我 能帮忙就代表我能发现问题、解决问题,从这个角度去看就可以知道很多人都需 要统计,无论是工业统计、计量经济、调查管理或生物统计各个领域都认为统计 很重要,反而现在只有统计人认为统计不重要现在健保实施了,生物统计想在 卫生署的药检局里积极推动一件事,因为现在任何药的检定是「可」经过统计检 定,我们希望把这个「可」改成「得」,任何新药必须先经过统计检定才可以上 市,任何人体实验必须经由统计检定才可以通过美国的NHI就是这么做,所 以一方面在国家卫生研究院,一方面在卫生署,我们会积极去推动这个观点,如 此一来,无论是生物统计或是医药、农药等各方面都需要统计,更不用说品种试 验还是计量经济了既然每个领域都认为统计重要,统计人该如何去看自己的角 色与定位呢?相信很多研究统计的学者常感疑惑甚至产生混淆,比方说有一次中 国统计学报与中国统计通讯表明只能送会员一本,结果大部分会员都要选中国统 计通讯,经过我询问的结果,原来大家觉得中国统计通讯才看的懂,怕看不懂中 国统计学报。

其实这是一个蛮大的问题,并不是我们要否定学术,假如你看过由 美国统计学会出版的一本很有名的管理杂志--JASA,它在世界上统计类杂志的 排名应该有前五名,若除开原文的因素,在后段至少有三分之一的文章是容易看 得懂的,因为后面有很多是属于CASE STUDY,没有太多数学公式,他告诉你 怎么分析奥运选手的纪录,告诉你怎么分析一些工业污染指数的技术,这些东西 有没有学问?学问可大了!但在国内我们反而常会认为没有公式就没有学问,就 像我为学生口试论文时,学生给了我一堆公式,结论却只有一点点,问他那些公 式是什么?学生说不写一些公式好像会让人觉得没有学问,这就是一个盲点任 何产业、领域都有其上中下游,统计也一样,基本上会先有一个理论或方法论, 再来才是数据分析,在上中下游互相循环推动下,产生领域的专业性,但是我们 常把统计陷入数学的泥沼里,以为统计就是数学堆砌出来的,因此发生疑惑,数 学当然是统计的基础,它绝对有其重要性,就像物理电子对信息产业的重要性一 样,但是信息业以及各项软硬件设施之发展方向却又比电子领域更广,同样的道 理,统计虽可视为由数学所发展出的旁支,但是统计在应用科学上更加发挥了可 长可久的境界,此时统计在各个领域中扮演着越来越重要的配角,也就是前面提 过的理论方法与数据分析间的关系。

很多人常认为数据分析不重要,学问不大, 其实真正的学问就在此,如何将数据整合?如何定义数据?如何转换数据?以何 种方法处理数据?类似这种情形,并非单靠纯粹的理论就可以解决,所以统计在 各领域中也就益加显出其重要性了举个例子来看,瑞辉大药厂里光是一个 research center就有一百多个统计人员,差不多是我们主计处的三四局,由此可 见其重视统计的程度,一个药厂已是如此,更不用说是NHI或是国家卫生研究 院了我自己做过一个简单的调查,市面上出版的统计中文书至少有一半甚至三分 之二以上都不是学统计出身的人写的,在这里我没有批评的意思,好比大家在准 备高普考,手边经常拿着颜月珠教授的统计学,颜教授本身并不是统计出身,但 是却写了很多统计学的书问题出在哪里?非本门科系的人都懂统计,他们学了 很多东西后发觉统计很重要,所以回头来写统计的书,最近台大商学院也出了两 本统计,类似四人帮写的经济学一样,写的相当不错由此可以看出别人都很重 视统计,尤其经济学中的计量经济更是重视,他们或许正暗自窃笑,你们统计人 好像都不重视统计,刚好让我可以涉足进来分一杯羹而统计人却又常把统计写 的太像数学,使人觉得统计不是那么平易近人。

另外,环顾现在研究所硕博士补 习班教统计的老师,大部分都不是学统计出身的,而是学经济、企管等相关科系 的,他们学统计、考统计是一把罩,长此以往,若是统计人再不振作,那别人最 高兴了,他们学本行一把罩,统计方面又是一把罩,由大约百分之六七十的研究 所都考统计这点可看出统计对其他领域的重要性,他们希望把统计的观念与技巧 都学过去这时统计人应该更有信心,在学习上、在专业领域里更加努力,我想 强调一点,作为一个统计人的正确观念应该是一 把人家的本事学过来我现在主要从事民意调查的工作,而民意调查的核心实际上就是统计中的抽 样所以要是统计这部分做不好,其它无论再加上什么社会学、政治学都没有用, 但是换个角度想,除了把统计做好外,更要去学政治学、社会学这些相关学问来 解释统计的结果学习别人的专业并非全部都要学,而是挑重点学,因此在学校 里我经常鼓励学生修习第二专长,最好去修辅系,哪怕是文学院或音乐系都好, 别以为没有用,辅大音乐系主任就经常找我,他常常在分析不同时代或不同音乐 家的音乐特性,因为音乐是可以量化的,而统计当然可以解决量化过的数据;另 外在文学院,无论台湾或大陆学者都在分析红楼梦到底是不是曹雪芹写的,有些 人认为是它的自传,有些人认为后半不是出于其手,他们利用统计中多变量分析 的主成分分析法来研究,怎么做呢?以书中出现「之、乎、者、也」的频率经过 量化后去分析;清大江永进教授研究母语时经常到菜市场搜集每个人讲话的音频 以及词汇运用的频率,希望藉由统计分析后能编出一部台语的辞典。

文学院和音 乐系利用统计的情形尚且如此,更不必说其它科系了!所以我希望统计人能培养 第二专长,以统计为核心再去学别人专业的部分,如此才会有更广阔的发挥空间我本身并非社会学者,更不是政治学者,但是在民意调查的工作当中,我会 很虚心的去学习他们的专长,以便做出正确的判断例如总统大选的时候,统计 报表出来后,我会观察瞿海源教授他们怎么去分析,有哪些观点,另外我会去看 一些政治或社会学方面的书,慢慢的我可以明白专家怎么去看统计数字,因为从 社会学或政治学的角度去看统计数字和我们一般看数字的角度是不一样的,因而 此时身为统计人一定要有一种心理建设,要去把别人的东西给学过来,而不是只 在统计领域中钻营而已很多人跟我说现在的统计分析太容易也太简单了,把资 料丢进MINITAB、SAS、SPSS,结果就出来了,我常笑着说这叫做「GARBAGE IN, GARBAGE OUT」,把一份不明缘由的数据扔进统计软件,跑出来的分析结 果还是不明究理,垃圾进去垃圾出来,一蹋胡涂也一片朦胧,唯有统计专业人员 才比较懂得如何去分析,懂得如何善待与利用数据,因此身为统计人一定先要有 统计方面的专业素养与技术,在此想强调的是统计有用论,至于如何使其有用? 这就是我的主题一统计的出世与入世观。

我经常用算命来解释统计有用论,常在报章杂志上出现的命相大师文昌居士 曾说过一句话,「算命就是另类统计学」,没错,统计学里的empirical rule、 bayesian prior information > posterior probability 等等,都很符合算命的精神, 而算命的过程当中,无论是紫微命盘或是排八字等方法,其实也都是机率和排列 组合的问题,至于看手相则可视为一种经验累积,而经验的累积正是统计学简单 的基础所以我常说学统计的人很适合去算命,也常和学生开玩笑说大概四、五 十岁后要去开命理馆,因为这也算是家学渊源,外祖父远从清朝便在泉州学算命, 后来成为算命师后,我常在一旁帮他温酒,舅舅现正在南部凤山帮人看相,有时 候会开玩笑地跟舅舅说,反正算命又算不死人,你这样算到底准不准啊?他说准 不准在个人,信不信也在个人实际上这一整个过程对我来说都蛮清楚的,假如 学统计的人可以将之理论化、科学化,绝对可以做的更好的,因为算命的基本背 景就是统计资料,任何算命师的观点都是一种统计资料,好比现在省府经常在推 动的统计数据库或是首长信息系统,将来就是一个很重要的首长算命系统,赖以 决定用人的准则。

所以统计对各领域的需求而言都是相当重要的从前常把统计形容成笑傲江湖小说中任我行的吸星大法,现在觉得太邪气 了,应该用天龙八部中的北冥神功来比喻,基本上都是一种吸纳整理的观念,因 为统计可以将庞杂无章的数据经由整理分析后成为有用的信息,这是统计最 powerful的功能现在大家学统计、用统计,必须抱持一个观念「统计就是生 活、统计就是人生」,你投入的工作就是你的生活,你投入的工作就是你的人生, 在研究统计当中培养工作和人生之间紧密的结合,你会发现这是相当有趣的另 外我们来看看统计的时代意义,1992年世界上最好的杂志Science有一篇报导「Statistic data analysis in the computer age」,现今计算机的普及率节节高升, 很多人认为计算机发达后统计就没有价值了,其实正好相反,计算机愈是普及、 愈是发达,就愈能带动统计发展,提升统计运作的效能,从前跑一个回归分析就 得花好久的时间,现在只是弹指之间的事,更不用说是多变量分析了计算机让 统计变简单,并不代表学统计没有用了,并不代表数学不见了,因为数学正是这 些计算机统计软件的背书,是理论的基础其实我们真正该考虑的一点是改革统 计教育,因为在这个计算机时代里教学生去算微积分、去背公式,都是没有意义 的动作,现在MAPLE、MATHMATICS、MATLAB等等软件都可以解决高等微 积分的问题,重点应该是教导学生如何去利用这些工具,如何去应用,我们教初 等统计学时,一开始就是一堆£、0、JJJ什么的,商学系的学生一看就昏倒,该 教的是让他们知道统计有什么用,变异数是什么意义、回归分析的应用范围在哪 里、机率分配的定义是什么、数据分析该怎么进行、而不是一开始在前三章就硬 塞一堆分布跟公式,看到这些统计公式很多人就傻眼了,因而对统计产生距离感, 其实统计应该是一个很亲切、很实在的东西,和计算机结合后更是形成一种非常 powerful的工具,这些都是我实现于教学及工作上的的观点。

统计一定要跟信息结合,而非哪一方并掉哪一方,现在如果有人还存有谁并 谁的观念,它不但不懂信息,更不懂统计!更甚者有人认为要裁掉统计基层调查 网,裁吧!裁了就知道厉害了,建立一个调查网十分不易,改善调查网更是重要, 既然已经辛辛苦苦地建好调查网,怎么可以随便撤掉呢?少了调查网的话,物价 怎么出来?人力资源报告怎么出来?将来整个世界评比的结果,我们的统计指标 会是倒数几名,那么谁还敢相信我们的东西?就像现在的中国大陆,大家都拿他 们的统计指标再乘上某数,调查物价时不许抽样的物品涨价,其它的涨翻天都不 管,这叫做控制物价指数,像这样的指数能相信吗?这样还需要调查吗?我告诉 你就好了嘛!这种情形就是不懂统计的人在做统计,所以统计人应该很诚恳的告 诉他们若是失去这片天地会造成多大的影响,并不是我们在自吹自擂,而是统计 的确有其实用性,没有统计的话,所作决策失败的机率就愈高,这一点身为决策 者应该让主管了解至于统计在未来学界的发展,刁院士已于清大筹设一个整合 数量、计量、经济、企管、财经各领域的人才的组织,并报导在经济日报上,因 为台湾正朝向亚太营运中心的目标迈进,所以培养计量分析人才是当务之急,而 统计就是计量分析的基础,这是一个未来极具前瞻性的发展。

统计现正在主计处 中部办公室大力持续推动支持下要成立统计数据库,相信一定会开花结果的另 外全球商情信息系统也已进军台湾,因为在台湾的数据库有相当丰富的商机,尤 其是统计数据库,因此公务单位必须正视这个问题,这也就是我一直强调的将信 息与统计结合以发挥相乘效果,而不是谁并谁这种无稽的想法SCIENCE有一篇文章列出近百年来最有用的科学,统计高居前十名,而统 计在各领域中扮演的是服务大众的角色,是整合所有数据及信息的重要角色而 台湾在统计方面的另一个发展方现就是consultant center,如今几乎每一个大学 统计系都已经成立统计咨询顾问中心,无论逢甲也好、东海也好,希望政府中的 统计相关单位能尽量利用,就近询问这些统计咨询顾问中心,相信他们都会很乐 意帮忙的不管是学界或业界,统计有用的观念已经渐渐形成,并且已有人开始 构思成立类似企管顾问公司或咨询顾问公司一般的统计咨询顾问公司,因为资料 愈来愈有用,卖数据正是时势所趋,例如民间单位的中华征信社,他们每年赚的 钱其实有一部分是大家帮他们赚的,因为他们把搜集到的统计数据经过加工处理 后再卖给厂商,一卖就是十万二十万,所以像我们这些经常在做数据生产者的人 却没有进一步成为资料的加工者或再制造者,其实是非常可惜的,大家应该考虑 结合成立统计咨询顾问中心来进一步运用统计。

在台湾统计的发展根据国科会自然处里面中数学方面的统计小组所拟出来 的包括有理论统计以及应用统计,所谓应用统计则包含工业统计及生物统计等 等,我总觉得少了一种很重要的统计--政府统计,在国外,无论是瑞士、瑞典或 美国等国家,最重视的就是政府统计,因为政府统计是一个最大的资料来源在 台湾普遍存在一种情形,就是统计领域的上中下游常出现断层,我常说我是个阳 春教授,是统计黑手,要是你有问题找我解决,我不见得会用很有学问的方法帮 你解决,可能是找个比较实用的方法来处理问题,其实台湾有许多功力高强的学 者,但是他们通常不愿意下海当黑手,这就是上游不见得愿意帮忙中下游解决问 题,而中下游又感觉上游遥不可及,不敢把问题告诉上游,觉得上游的理论太过 高深,听过降龙十八掌,却又不知道是哪十八掌,是故上中下游的循环发生断层 这是我认为应该加强的地方另外还有一个重要的问题是应该淡化统计的理学院 色彩,现在统计这领域愈来愈偏向管理学院或商学院,目的就是希望统计在这些 领域中和其它学科互相结合以美国ASA section的home page为例,其中分成 许多的section,连统计画图都自成一个section,环境方面、体育方面无所不包, 提到体育,美国之所以能成为体育强国,中国大陆之所以能培养出那么多优秀运 动员,都应该归功于他们的体育分析做的好。

其它还有医药方面的卫生统计及公 共卫生,社经方面的民意调查,在此不一一介绍,由此可知他们是多么重视统计, 没有统计对他们而言就像是断手断脚一般,我们身为统计人就是应该让主管及决 策者认为没有统计就好像缺手缺脚似的不便我现在每个月固定在学校扮演一种 角色,就是把省府的统计月报以及主计处的重要国情统计等重要的信息摘要整理 后提供各系参用,让各系定期感受我们整个国家社会的脉动,试验两个月后,我 想停掉这个工作,结果至少有二十个系主任打请我不要停,他们觉得这些资 料对他们很有用,从这一点看来我是成功了,所以只要愿意花心思去凸显统计在 各单位的整合性,一定可以让人家感受到有统计是多么方便比方要分析交通业 务,只要跟业务单位充分配合,无论是载客量或交通流量,当你分析完成后,有 你没有你就出现很大的差异了,统计在这个单位中一定会愈来愈吃香,变成一个 不可或缺的重要决策资源单位主计长曾指导过关于统计的分析观点以及技巧,希望在各领域中奋斗的统计 人也都能有这种认知,那就是要对数字有感情,有这种感觉后便更能掌握数字, 更知道如何将数字便成有用的信息,提供决策者参考,如此才能在基础中不断求 新求变每个人都经常会为了许多事情烦恼,会为了生、老、病、死担忧,至于统计 人应如何利用统计的观点去面对人生呢,就我而言也许有点像三国演义的卷头语 写的「滚滚长江东逝水,浪花淘进英雄,是非成败转头空,青山依旧在,几度夕 阳红,白发渔樵江渚上,惯看秋月春风,一壶酌酒喜相逢,古今多少事,都附笑 谈中」。

如同前面所提,没有永远的永久,统计诉说的只是一个趋势,预测一个 现象,这些趋势和现象会随着时间的变动、随着物换星移,永远无法有人能掌握 永久,假使有人问我时间序列分析能不能预测到十年后、二十年后、甚至三十年 后,我会说「你是疯子」,那是不可能的!统计掌握住的是趋势,它能告诉你在 不同时间的不同变量有什么不同的看法,模式如何随之修正,所以不管从纵切面 或横切面去了解统计给你的趋势,进而掌握这个趋势,才去下比较正确的判断, 这不仅仅是统计人的工作与职责,更是统计人的人生观,统计人并不是差不多先 生,统计人看的开、达观、豁达、不争名、也不求利。

下载提示
相关文档
正为您匹配相似的精品文档