语言测试与评估第一节语言测验的基本原理一、语言测验的作用和目的 作用:科学地测量出学习者的语言能力目的:我们使用测量工具时要达到的目的1、选拔 2、诊断 3、评估 4、研究二、怎样用科学方法测量语言能力1、测量的定义:测量是给人或事物的某种属性确定数和量的过程2、测量的四个要素:测度(测量的对象、可测量的属性)、测量单位、数字(实数)系统、零点0)3、四种测量水平和四种量表顺序测量 顺序量比率测量 比率量称名测量 称名量表表等距测量一一等距量表表4、 测量对象及其性质 显性 隐性5、 自我测量工具 非自我测量工具6、 测量中心:以主体为中心 以刺激为中心 以反映为中心 测量水平和测量中心 语言测验的中心7、怎样使不可测的东西变为可测的一一虚构测度(可 测量的属性)三、测验的种类1、按用途分水平测验一一能力测验或熟练程度测验语言水平指学习者能够使用目的语完成听课、做 翻译、经商、旅游等目的的语言能力如汉语水平考 试(HSK)其特点是不以教材为基础,没有明确的内 容范围,一般是标准化测验成绩测验一一以教材为依据的测验,不一定是标准 化测验能力倾向测验一一教学前的测验,了解被试是否具 有学习语言的潜在能力。
分班测验一一教学前的测验,了解被试的语言水平 等级,以确定进高、中、初级班诊断测验一一教学中的测验,为了发现问题,改进 教学依据所测能力信息指向标准化程度规模水平测验语言理论一般语言水平将来最高最大成绩测验教学内容不一定过去可以较高可以很大倾向测验认知理论学习潜能将来可以较高可以很大分班测验教学内容现有水平将来不高不大成绩测验教学内容现有水平过去将来低小2、按测验方式或评分方式分主观测验和客观测验:在评分过程中需要评分员自 己作出判断的,就是主观测验;评分时不需要评分员 做出判断的就是客观测验分立式测验和综合式测验笔试和口试纸笔测验和计算机辅助测验3、测验的标准化第一,有固定的、标准的内容第二,施测和评分按标准程序进行第三,题目都经过预测第二节规划、设计和实施一、规划设计第一节确定目标团体语音测验的目标团体年龄:18岁以上的成年人母语:英语一般教育情况:高中毕业、在校大学生对语言测试的熟悉程度:大多数参加过HSK考试,部分参加过英语考试,对各种测验形式熟悉第二节确定测验目的教育、选拔人才、改进教学第三节确定测验内容教学内容、非教学内容第四节确定测验方式和卷面构成题型:客观题、主观题题量:考虑信度和时间题型题量分布表客观题(选择题)主观题(作文)语法词汇听力阅读应用题型120202020题型2202020题型31总数402040401汉语水平考试的题量和时间分布考试内容试题数量试题比重答题时间听力理解5029.4%约35分钟语法结构3017.7%20分钟阅读了解5029.4%60分钟综合填空4023.5%30分钟共计170约145分钟第五节确定评分方式和分数体系客观评分、主观评分主观题的评分标准和分值分数整体评分标准分项评分标准词汇。
语法主题结构总分4词汇丰富,语法正 确,主题鲜明,结词汇丰富,没有错别无语法错 误主题鲜明结构完整,衔 接自然16构完整字3词汇较丰富,语法 基本正确,主题鲜 明,结构完整词汇较丰 富,偶有错 别字偶有语法 错误主题鲜明结构完整,有 不连贯的地 方122词汇不丰富,语法 错误较多,主题不 鲜明,结构不完整词汇不丰 富,错别字 较多语法错误 较多主题不鲜 明结构不完整81词汇很有限,语法错误很多,尚能表达基本意思词汇很有 限,错别字 较多语法错误 很多,词 不达意仅能表达 基本意 思,看不 出主题结构很不完 整40不能表达基本意 思基本上不能正确使用词汇无合语法 的句子看不出基 本意思谈不上0二、 操作和实施、编写测验说明和题目细则一个简单的测试说明2、 训练命题员3、 聘请专家组就有关问题进行咨询三、 施测、信度、效度及后效研究第三节客观题的编写与修改一、客观题的类型一、多项选择题1.1多项选择题的原则1.1.1每一个多项选择题只能有一个正确答案例1目前还没有发现这类问题①现在②最近③看来④在眼睛前边 例2我们两家住斜对门,关系很好①隔壁 ②邻居 ③门有些斜 ④门靠门1.1.2 一个题只测一个语言要素例3他们都认为这是个好主意。
①意思②办法③态度④建设1.1.3除了测验特殊语法点的题目外,其他题目的 选项放到题干里都要合语法1.1.4多项选择题所用文本不能太难,要适合考生 的水平在语法题中,不要包括比要测的点更难的 语法点;在词汇测试中不要出现比要测的词更难的 语义问题题目越单纯越好1.1.5多项选择题越简洁、越清楚越好1.1.6多项选择题在试卷中一般按从易到难的顺 序排列在试卷前面放几个容易的题,目的是把考 生引入测验如果试卷开头就碰上非常难的题,考 生可能一下子被考住了,后面的题目再容易也做不 下去了1.2多项选择题题干 题干的作用是把问题简明扼要 的提出来,考生可以从题干中获得如何答题的全部信 息题干里不要包括与题目无关的内容,以免分散考 生的注意力1.2.1 一个有待补充的陈述例4他是班里最小的,学习 是班里最好的1.2.2 一个完整的陈述例5她爱人带这孩子去广州了A丈夫B哥哥C父亲D朋友1.2.3 一个问题例6服法:每次四片,日服三次,儿童减半,或 遵医嘱,温开水送下问】根据说明,这种药儿童每次只能吃多少?A两片B三片C四片D五片如果选项里有重复的词或词组,尽量想办法把它放 到题干里去例7这段话告诉我们什么?A肥胖威胁儿童的健康B肥胖威胁妇女的健康C肥胖威胁青年的健康D肥胖威胁老人的健康1.3选项1.3.1正确答案一定要是唯一的。
1.3.2干扰项都要有干扰作用1.3.3选项长短尽量相等2、完型填空典型的完型填空是等距填空汉语使用的是综合填空例8昨天,我们去参观了一个展览展览会上的工艺 品件件都上,尤其是玛丽买的这一件,又美观,又• •11 Oi A精确B精致C精彩D精神11 A实用B实在C实际D实惠3、 配伍题例9左边的词都能和右边的某个词组成词组,请用连线表示开展 领导请示 矛盾埋没 工作揭示 人才4、 是非题例10判断下面句子的正误我把饺子吃在饭馆里了5、 半客观性试题答案是唯一的,但需要阅卷员来判卷例11感谢《读者》杂志社的全体工作人员,为中国 广 的文化市场_造出一份好的精_食粮,你们立 于峰巅,却能做_虚怀若谷,相_你们会做得更好二、适应于不同技能的多项选择题一、听力理解试题听力测验可以测语间的听辨、特殊信息的获取、整段 话语的理解,也可以考查被试的交际能力,如听到一个 问题,被试按语境的要求做出回答听力测难验究竟测 什么,要根据测验目的来确定一) 选择材料选择材料时,一定要联系测验目的来考虑听力使 用的应该是口语材料材料可以从广播、教材、剧本中 选择既然是听力测验,所用的材料一定得上口如果 选择的是书面语材料,尤其是句子长、句式复杂的材料, 题目的区分度不高。
题目的区分度低,说明很多被试是 凭猜测答题从广播、电视上选择的材料,如果录音质量不高, 应该重新录音有些程度较高的交际性测验可以直接使 用广播材料,这种材料可能带有一些噪音如汉语水平 考试(高等)听力理解第二部分,所用材料是从广播中录 下来的现场米访二) 编题听力理解题可以根据要测的不同能力,用不同方式, 从不同角度出题听力测验中又包括各种题型,如:听 辨语音、重音和语调、用图画测听力理解、叙述和对话、 理解谈话和讲话等当然,在一个测验里,一般不可能 把这么多测听力的方式都用上,我们应该根据测验的要 求选择两三种适当的方式我们以叙述和对话为例,介 绍一下听力测验的命题原则1 .问题要用完整的句子,一定要简洁听力题的材 料和问题,被试都是从录音中听到的,需要他理解的是 录音材料,因此,提问题所用的语言,一定要比原材料 的语言更简单这样做的目的是,不要让提问题所用的 句子给被试造成困难如果提问题用的句子非常难,被 试听不懂,他就不知道如何答题,我们也就无从知道他 是否听懂了材料里的内容例17.女:金光辉被三星公司录用了吗?男:别提了论专业知识、身体条件、工作能力, 都没说的,就是没有汉语水平考试6级证书。
问:金光辉在哪一点上不符合公司的录用条件?A. 汉语水平 B.身体条件C.工作能力 D.专业知识例17提问中使用的“在哪一点上”、 “符合”等 词语的难度,可能比对话中所用词语的难度还要大,这 可能会影响被试对问题的理解我们可以把提问及选项 作如下修改:问:金光辉为什么没有被录用?A.汉语水平不高 B.身体条件不好C,工作能力不强 D,专业知识不多2 .如果使用多项选择题,选项使用的语言也一定要 简单,对被试不构成困难道理和第一条一样,如果选 项太难,被试看不懂,他就没法作出正确选择给低水 平被试使用的测验,可以酌情考虑用被试的母语编写选 项,也可以用图画作选项这样,选项就完全不是障碍了3,在听力题中,尽量避免让被试过多地记忆有的 理论认为短时记忆是听力技能的要素之一,因此,也可 以有少量的题目涉及,记忆但记忆题目不要过多,不 要使被试的记忆负担太重4, 在听力测验中,涉及计算的题目(如例18)最好避 免,因为这不是测验算术能力汉语水平考试的早期题 目中,经常有涉及计算的题目,后来我们发现,这些题 目区分度大都较低淤例18男:我18岁时离开父母亲人,去北京上大学,算起 来,已经整整30年没与家人团聚了。
问:他今年多大了?A.18 岁 B.30 岁C.48 岁 D.50 岁5, 如果是长段叙述或对话的理解,一段话后面往往 带有好几个题目,在这种情况下,提问的顺序最好和叙述或对话的发展顺序一致二、阅读理解试题阅读理解测验的材料可以从教材、教材辅助读物中选 取为了保证题目的真实性,阅读材料也可以从公开发 表的报纸、杂志中选命题员应根据测验的目的选择适 当的材料如果是大规模的水平测验,材料的范围越广 泛越好例如’TOEFL和汉语水平考试的阅读部分涉及的 内容都很广泛为了使被试读到真实的材料,命题员不 要修改原文,适当的删节是允许的,但要有节制,尽量 保持文章的原貌阅读材料不能太长,一般以二三百字、 三四百字为宜材料选好以后,命题员要把材料仔细读几遍,吃透文 章的各个方面,包括主题和各个细节只有在对文章有 了较深入的理解后,我们才能找到好的切入角度,出好 题目一段阅读材料可以出三四个到五六个题目题目需 要预测,因此出题时要多出一两个,打出富余,预测后 如果有一两个题数据不好也没关系,删掉就是了根据 一段阅读材料编出的题不要都在一个平面上,应该涉及 主题、具体细节、文章的连接关系、作者的观点或态度 等各个方面。
阅读材料一般都是从原文中节选一段,而 且没有标题,为了使被试能首先把握全文主旨,第一个 题目最好就全文的主要内容或中心意思提问其他问题 可以按照文章发展的脉络依次提出在阅读测验中,可 以就作者的“言外之意’’提问,也就是让被试作出一些 推论或猜测我们也可以就某个比较难的词或概念提问, 看被试能不能根据上下文猜出这个词的意思这样,根 据一段阅读材料提出的几个问题,就包括了对主题的把 握、对细节的理解、对作者态度或言外之意的理解以及 跳跃词汇障碍等几个方面的考查总之,阅读测验应尽 量考虑到阅读过程中的全部因素,并就这些因素一一提 出问题阅读测验是一段文章后跟几个题目,命题时要特别 注意题目之间不要有暗示,也就是说,题目之间不能有 连锁影响,要使每个题目都有独立性这个题目答对答 错都不会影响下一个题,否则,一个题答对了,其他所 有题就都对了;一个题错了,其他题也都 错了现在我们来看一个例子例 19—24.还在大学里,我的一位女同学发表过这样的观点她说,假如有个男同胞在她面前打个嗝,那么哪怕他再优秀,也绝无同他发展下去的可能这话多少有点儿孩 子气,也近乎苛刻了,但有时候,这样的细枝末节还真 能左右人的选择。
记得很久以前我父亲的一个学生经人 介绍认识了一位容貌平平的姑娘,第一次见面后他决定 继续保持联系的一条重要理由就是:当他们在看电影的 时候,那个女孩吃完了手中的冷饮后,把包装纸缠在木 棒上始终拿在手里,直到走出电影院才投进垃圾箱她 做得非常自然,不像是故意做出来的仅此一个细节, 她体现出了自身的教养;仅此一个细节,他们终于喜结 连理另一个女友在决定终身大事时,也强调一个细节, 有一次那位先生在离开宾馆的房间时,将房间里的灯一 个一个关掉,那一瞬间,她决定:就是他了例19作者的主要观点是什么?A. 生活小事反映人的教养B. 保护环境要从小事做起C. 再优秀的人也有小毛病D. 节约用电也是保护环境例20 “绝无同他发展下去的可能”指的是哪方面的 事情?A. 爱情 B.生意C.友谊 D.学问例21本文作者的父亲最可能是什么人?A.教师 B.演员C.医生 D.导演例22. “喜结连理”大概是什么意思?A.结婚 B.庆祝C.联系 D.整理例23.本文最后一句“就是他了 ”表示什么意思?A.爱上他了 B,认出他了C.见到他了 D. 了解他了例24.本文作者举了几个真实的例子7 ・A.两个 B.三个C.四个 D.五个三、语法试题语法试题测的是被试的语法能力,语法题要能反映 被试是否掌握了语法结构。
有人认为,语法试题测的就 是语法知识这种说法太笼统,容易引起误解我们应 该区分两种“语法知识”,一种是语言教师和语言学家的 语法知识,一种是语言使用者的语法知识什么是主语, 什么是谓语,一个句子该怎样分析,这些都是语言教师 的语法知识语言使用者和第二语言学习者的语法知识 是另外一种知识使用一种语言的人, 比如说使用汉 语的中国人,知道“我吃饭”是对的,而“饭吃我”是 错的,但究竟为什么错,他可能说不出来他不能对错 误进行分析,也不能对正确的句子加以解释就第二语 言学习者的情况而言,我们需要知道的是他能否正确地 使用语言形式,而不是他能否正确地分析一个句子因 此,我们不能把分析句子、解释虚词等作为语法试题的 内容设计语法试题,要注意两个问题:第一,充分考虑汉语语法的特点汉语和英语等印 欧语言不同,汉语缺乏形态变化,把汉语的字、词连成 句子的主要手段,是语序和虚词这是汉语的特点第二,要充分考虑学习者的特点第二语言学习者 往往是在掌握了母语后才学第二语言的,这时,他在第 二语言上出的错,往往是母语干扰的结果,即他可能是 用母语习惯来表达第二语言例如,说英语的人可能用 汉语说出“都我们不来”这样的句子,这是因为,英语 里表示“都”这个意思的词可以放在句子的最前边。
因 此,设计语法试题,应该以第一语言和第二语言的对比 为依据具体地说,语法试题的正确答案当然是汉语的 正确表达,而干扰项,应该是学习者在母语干扰下可能 出现的错误如果干扰项缺乏依据,不是被试可能出现 的错误,题目的质量就可能不高,而这有可能表现为题 目的区分度不高汉语语法的特点是语序和虚词,还有一些特殊句式, 我们可以把这些内容大致列一个表,供编写语法试题时 参考如果测验有详细的语法大纲,我们可以从大纲的 项目中抽取一个有代表性的样本,作为语法题要测的项 目语法试题的常用形式有以下几种:(一) 选择填空选择填空的题干是一个句子,中间留出一个或两个 空,空中应填上正确的虚词如:例25,昨天我买了一()雨伞A.把 B.根 C.支 D.个例26.义务教育,()是国家对人民的义务,() 是家长对国家和社会的义务A.既……也…… B.既然……就……C.虽然 但 D.不是 就是 (二) 选择位置这种题的题干是一个句子,从中挖掉一个虚词,句 中给出A、B、C、D四个位置,被试要指出这个虚词放在 句中哪个位置上最合适如:例27,我是多么A多么B多么C高兴D啊地例28.他打算A吃B饭C就进D城了这种题实际上是一种排序题,是给被试一个句子的 四种不同排列,让被试从中选出一个正确的排法。
使用 这种方式只是为了节省篇幅,它和下列方式是等效的:例29.A. 他打算了吃饭就进城B. 他打算吃了饭就进城C. 他打算吃饭了就进城D. 他打算吃饭就进了城三)排序我们说过,语序是汉语重要的语法手段,因此语序 是语法测验的一个重要部分语序问题包括:多重定语 和多重状语的次序、状语的位置、定语或状语和中心语 的位置、补语和中心语的位置等下例就是关于多重定语的次序的例30.()领子会使人相信他是最爱清洁的人A. 他的内衣的雪白的B. 内衣的他的雪白的C. 内衣的雪白的他的D. 雪白的他的内衣的(三)挑错被试对语法的掌握,不仅表现在能正确使用汉语的 语法形式,而且还表现在能识别不正确的形式上有的 语言测验通过让被试识别错误,来测量他对语法的掌握 程度这种题的题干是一个包含了一个语法错误的句子, 然后在句中标出A、B、C、D四个位置,其中一处是错误 所在,其余三处没有错误被试的任务是把有错的一处 指出来例31.都我们学习汉语A B C D这个题目要求被试指出错误在上句中的哪一部分 编写这种试题时要注意,一个题目中只能包含一个错误, 否则答案不惟一句中的语法错误,应该是来自学习者 在学习过程中出现的错误,不要使用教师或命题员人为 编造的错误。
四、词汇试题词汇测验首先要解决的问题是测哪些词在成绩测 验中,被试使用的是同一个教学大纲或同一种教材,所 测的词汇当然就从大纲或教材中选如果是在水平测验 的情况下,被试成分复杂,没有一个大纲或教材适用于 所有被试,我们就可以考虑从一个通用的词表或频率词 典中选择词汇在教学测验中,有时也可以专测学生容 易出错的词一个测验中实际用到的词,总是该测的词 的一小部分因此,无论是在什么情况下,我们都应该 使实测的词是该测的词的一个有代表性的样本汉语水平考试(初、中等)有20个词汇题每次命题 时,我们从《汉语水平等级词汇大纲》的甲、乙、丙三 级词中随机地选出要测的词条(用计算:机抽取),然后 用这些词编写题目要测的词条选定后,我们到各种出版物中寻找带这 些词的句子,找到了合适的句子,这些句子就是词汇测 验的题干词汇测验的形式是,题干中有一个划线的词, 下面给四个选项,要求被试答出哪个选项和划线词的意 思最接近如:例32,我昨天去商场买写字台A.桌子 B.椅子 C.箱子 D.柜子A.书桌 B.餐桌 C.茶几 D.梳妆台编选项时要注意:(1) 四个选项和划线词要属于同一词类如果划线词 是名词,四个选项也都应该是名词。
2) 四个选项的搭配习惯应该和划线词的搭配习惯 一致3) 四个选项的难度应该大体相当,其中不要有一个 特别难的或特别容易的上述第一、第二点也可以归纳为一句话,那就是题 干所提供的语境(非划线部分),不能对所测的词和选项 的关系形成暗示编好选项后,把每个词都放到原句中读一遍,只要 句子语法正确、意思通顺,前两条就算做到了选项用 词的难度,可以根据词频辞典或教学大纲来控制词汇试题测的是被试掌握的词汇量,不要把文化知 识、搭配习惯、词义辨析等内容放到词汇题里词义辨 析是语义问题,文化是知识问题,这都可以在阅读理解 或综合填空里去测;搭配习惯是语法问题,应该用语法 题来测下面我们来看一个处理不当的题例33,办喜事时,他们的新房很简陋A.新盖的房子 B.新买的房子C.刚刷过的房子D.结婚用的房子例33是用词汇题的形式测文化知识,但该题却有很多 问题首先,该题的形式不合要求,四个选项没有一个 能替换题干中的“新房气其次,“新房”只有当“结婚 用房”讲时才是一个词,这是就这个词在词典上的地位 而言的,在其他情况下(选项A、B、C)都是词组:如果不 区分词和词组,选项A、B也是正确答案,而表明“结婚 用房”才是正确答案的,不是仅仅是“新房”这个词本 身的意义,还有“办喜事”在起暗示作用。
第三,这个 题有一定的诱骗作用,因为“新房”究竟是一个词还是 一个词组,恐怕只有语言学家说得清楚,一般人,尤其 是第二语言学习者把它理解为“新盖的房子”等并无大 错;如果他是这样理解的,我们弄不清他是不认识这两 个字呢,还是不知道它的文化意义第三节题目的修改如果题目的质量不高,在开发测验的整个过程中, 我们有两次机会修改题目第一次是在毛坯题编出来之 后、预测之前当题目主要由命题员编写时,在题目预 测之前,专业人员要对毛坯题进行审查和修改审题的 人应根据我们上面介绍的那些原则和规则,把题目内容 和形式上的毛病改掉这些毛病包括答案不惟一、无正 确答案、选项长短不齐以及敏感性问题等有经验的命 题和审题人员能够发现毛坯题的很多问题,在题目进入 预测之前,凡是能挑出的毛病都应该挑出来,凡是能修 改的都应该修改如果题目是专业人员出的,最好也在预测前请别人 看一下,挑挑毛病一份毛坯题,可以在同事之间传看, 大家互相挑毛病,也可以请教学和测验方面的专家来看经过这次修改,题目的很多问题就可以解决了但 是,题目的另一些问题,如不预测,是表现不出来的 所以,我们还应该根据预测数据,对一些有修改余地的 题目做进一步的修改。
根据预测数据修改题目的例子, 我们将在第五章中介绍思考题1. 客观性试题有哪些主要类型?2. 使用客观性试题的基本原则是什么?3. 听力题和阅读题所使用的语言材料有什么区别?4. 编写语法题时应该注意什么?5. 编写词汇题时应该注意什么?第四章主观性试题的编写我们常说,客观性试题评分容易,出题难;主观性 试题出题容易,评分难实际上,编写口试和作文中使 用的主观性试题,也是需要周密设计的第一节 口 试简单地说,口试就是让被试开口说话,根据他说出 的话,我们来评价他的口语表达能力口试的方式可以 分为两种:面试和录音相应地,口试的评分方式也分 为两种,面试是当场评分,录音则是事后评分一、口试的方式(一)面试面试的基本形式是主试(主考)和被试面对 面地交谈,主试提出问题,被试回答;根据被试的回答 情况,主试给被试打分面试又有几种不同的形式第一种是一位主试,一位被试主试的工作是向被 试提问,并根据被试的反应给他打分这时,主试既是 控制口试进程的人,也是评分员第二种方式是两位主试和一位被试一位主试负责 给被试提问,和他交谈,另一位主试不参加谈话,他只 负责给被试打分第三种方式是两位主试和两到三位被试。
一位主试和这两三位被试轮流交谈,另一位主试负责打分有人还采用过这样一种方式,也是两位主试对一位 被试,不同的是一位主试是以被试的面目出现的,这时, 被试以为是一位主试同时测两位被试装扮成被试的主 试有缓和气氛的作用他还负责引导被试充分表现自己, 当被试卡壳时,他以另一被试的身份,提醒被试就恰当 的话题继续说下去面试在形式上真实、自然,主试和被试的交流是直 接的,主试和评分员得到的印象也是直接的面试的缺 点是难于大规模施测当考试规模很大(如上千人)时, 采用主试和被试一对一的方式,我们就需要培养、训练 大批的口语主试另外,面试也是很费时的对一位被 试的面试,一般以10到20分钟为宜,最短也不能少于5 分钟试想,如果有上千人参加考试,累计考试时间将 在200个小时左右所以,大规模测验要采用面试的话, 我们就要认真考虑时间和人力成本问题二)录音由于面试需要较多的人力和时间,人们就采用了一 种变通的方式——录音其基本做法是:把题目要求印 成试卷,被试集中在有录音设备的考场,被试根据试卷 上的指令,把该说的话录在磁带上,事后,考试机构把 磁带收回,请评分员听录音评分这种方式的优点是显而易见的,测验时不需要大批 主试,只要有足够的录音设备,就可以对大批被试同时 施测。
但它的缺点也很明显首先,测验情景不太真实, 测验过程不是被试和主试的交流,而是被试的独白一 些性格内向、不擅言辞的被试在缺乏激励和引导的情况 下,可能觉得无话可说另外,听录音评分也是极为耗 时的和面试相比,录音只解决了一个问题,就是可以 让大批被试同时参加测验二、口试的题型口试的题型有很多种,下边我们介绍几种常用的题 型,这些题型多数既可以在面试中使用,也可以在录音 中使用一)朗读正确的语音、语调是口语的基础,所以, 口试中常常有朗读这一项朗读的材料一般是成段的文章,但 对初学者,也可以使用单词和单句朗读材料要根据测 验目的来确定如果是水平测验,我们就应该选用一般 性材料,朗读材料中不要出现特别专业的知识或内容, 长度在200—300字为宜,被试的朗读时间大约是1—2 分钟如果是成绩测验,应根据测验细则的规定来确定 朗读材料的内容,这时,朗读材料可以是特定的词汇和 句子,也可能是包含特定内容的文章段落朗读材料应 该选择容易上口的,句子不能太长,不要有冷僻的字、 词二) 复述我们给被试准备一段材料,可以录在磁带上,让被 试听,也可以印成书面的,让被试读被试听完或读完 后,立刻复述材料中的内容。
复述的材料不要太长,也 不要太难,一般应选择有情节线索的故事,这样,记忆 的负担不会太重三) 问答问答就是主试提问,被试回答,这是口试中最常用 的题型主试提出的问题要事先准备好,以10个左右为 宜问答题的设计应注意这样几点:第一,问题涉及的 话题一般应该是被试熟悉、有话的问题,也不要问被试 可能不愿意回答的问题(如毒品、犯罪等)第二,一个 问答题是由一组问题(10个左右)构成的,这组问题应该 以一个话题为中心,围绕这个中心,提出若干个问题, 不要东一榔头,西一棒子,在一组问题中涉及几个关系 不大的话题第三,问题的广度和难度应该逐步展开, 前边几个问题要简单,被试容易回答,这有助于消除紧 张气氛,后边的问题逐渐深入,如果被试的能力强,他 就有可能说出更多的话来,充分地表现自己下面是一 个问答题的例子例34.谈汉语学习1. 你学几年汉语了?2. 你觉得汉语难吗?3. 汉语的发音、汉字和语法,哪个最难?4. 你为什么要学汉语呢?5. 你喜欢汉语吗?6. 你是喜欢汉语还是更喜欢其他课程(如数学、物 理)?7. 你认为哪门课程更有用?8. 你读过汉语小说吗?9. 你最喜欢这部小说中的哪个人物?10. 读汉语小说会不会影响你的学习?如果有影响, 你会怎么办?还需要注意的是,问答题不适于用录音的方式,因 为问答是在具体情景中的、现场的交流,当被试对一个 问题不感兴趣或没有回答上来时,主试要及时调整问题 的顺序或内容,而这在录音的情况下是无法做到的。
一)看图说话看图说话就是让被试叙述图画上的内容,图画就是 题干口试所用的图画可以是单幅的,也可以是连环画, 使用哪一种,根据需要而定单幅图画一般是描绘一个 场景,其中有环境、有人物,被试所要做的,就是用口 头形式把这个场景叙述出来连环画一般描绘的是一个 事件,这个事件有起因,有发展,有结果,被试要口头 描述的就是这个事件使用连环画通常以4幅左右为宜二) 讲述讲述按内容可归为两类,一类是介绍某种情况或某 件事情,另一类可称为讲解第一类题目跟讲故事差不多,可以让被试介绍一下 他(她)的家庭或学校、他(她)的家乡或居住的城市,也 可以让被试讲一件经历过的事情第二类是讲解,我们可以事先给被试一份录音机的 说明书(或类似材料),经过准备,让他给主试介绍一下 怎样使用录音机也可以让被试看一段广告或影片,然 后让他给我们介绍片中的内容三) 角色扮演这种题型是给被试提供一个交际场景,让被试在其 中扮演一个角色,根据场景的要求,被试要用符合身份 的表达方式达到交际目的(如例35)・例35.在场景中扮演角色场景一:你在市场上买水果,你认为价格稍稍贵了 一点儿,如何跟小贩讨价还价?场景二:你在商店买了一件衣服, 回家后发现自己不喜欢了,于是你想把这件衣服退掉,便回到商场。
怎样跟售货员商量,才能把衣服退掉呢?场景三:在路上,有人向你问路,你怎样给他指路 呢?把角色扮演作为口试题目时,应该多准备一些场景, 让被试在其中挑选熟悉的场景,以扮演适合的角色另 外,在角色扮演中,主试可以作为另一个角色,配合被 试完成交际任务四)讨论对于程度较高的被试,我们可以使用讨论题讨论 题涉及的内容可以比较广泛,给被试留出充分发挥的余 地讨论题应该成组地出,比如说每组三到四个题目 如果只给被试一个题目,而他正好对这个题目不感兴趣, 就无话好说了一组题中尽可能涉及不同的内容,被试 从中选择一个他认为最能表现自己的题目在发表自己 的意见前,被试可以准备一两分钟,写一个简单的提纲 考试时,被试可以看自己写的提纲被试的发言长度以 两三分钟为宜下面是一组讨论题例36.请你从下面的三个题目中选择一个,谈谈你的看法你有两分钟的准备时间,准备发言时,你可以做一个简 要的发言提纲准备好以后,请就你选择的题目作一个 三分钟的发官1. 男女平等问题2. 吸烟有害健康3. 大城市应该发展公共交通,还是应该鼓励私人 汽车?第二节作文语言教师一向认为写作是重要的,因为写作是语言 能力的综合表现写作测验的困难也是众所周知的,写 作测验难就难在评分上,给一篇作文评分,其中的主观 性太强了。
另外,如果大规模测验中包含写作,评分的 成本也是十分巨大的试想,给成千上万篇作文评分需 要多少评分员,又需要多少时间呢?因此,有的大规模测 验回避了写作问题,有的则用其他办法加以补救但是 在教学中写作是不可忽视的,写作是学习者应该具备的 一种能力为了克服传统作文评分的主观性,人们设计 了一些客观性较强题型,来测验被试的写作能力写作题可以分成三种类型:单句写作、成段写作、 成篇写作前两种评分较为客观,可称为半客观题或半 主观题,这两种题型基本上只适用于初级或中级的学习 者;第三种题型只是对作文的限制条件较多,仍然是完 全的主观题下面我们分别介绍一、单句写作单句写作包括组句、完成句子和改写句子,这三种 题型适用于初级水平被试写出语法正确、结构完整的 单句,是写作的基础从形式上看,这类题经常出现在 语言教材的练习中,很像语法题,但它和语言测验中的 语法题还是有区别的语法题一个题一般只测一个语法点,而单句写作,每一个题都是若干语法点和词汇的综 合运用另外,语法题往往采用多项选择,存在猜测因 素一)组句组句是让被试把一组顺序混乱的词组合成一个合乎 语法的句子命题时,我们可以选取一些句子,然后按词(不是按字) 打乱顺序,被试要做的就是重新安排这些词汇的顺序, 使之成为一个句子。
例37.用下列词语组成一个简单句注意:每个词只能使 用一次,每句只能在末尾使用一个恰当的标点符号校园他中在着走地步快不我应该知道实在我你打扰时候的疲倦这么你 在(二)改写句子改写句子是教科书中常用的练习方式,它也可以用 作测验题同一个意思,可以用不同的句式来表达,掌 握不同的表达方式,是写作能力的一个表现这里介绍 的,是用指定的句式改写句子一般说来,我们可以给 出一个结构上比较普通的句子,然后让被试用一个特定 的格式改写它,这个这特定的格式(如下例中的“一…… 一……地”和“把……”)往往是比较简练的用指定的 句式改写,答案基本上是惟一的,这有利于较为客观地 评分例38.用指定结构改写下列句子:一阵风吹来,墙上的画掉了下来一阵风 用“把……”结构)(三)完成句子完成句子有各种各样的形式,常用的是给出一句话 的前半句(或后半句),让被试补出后半句(或前半句) 我们在这里介绍另一种形式我们先选择一段短文,从 中删掉若干个句子,或删掉某句话中的若干词语,留出 若干个空儿,让被试根据这段短文的上下文,把删掉的 句子补充进去,使短文完整(如例39)例39.在下文划线处补出漏掉的句子或词语(完成句子):10—135月15日 星期天 晴今天,又是个星期天。
清早起床后,我熟练地把自 己的被子叠得整整齐齐早饭后,我写完了作业,1我先用拖把把地面擦干净,又帮妈妈擦玻璃 2,我先用一块湿布把玻璃里外认真地擦了一遍 然后,又用^^,直到把玻璃擦得能照出影子来才, 停止我帮妈妈分了忧, 4 得像喝了蜂蜜一样甜编写这种题要注意有两点:第一,所选的短文应该 是有情节的,所谓有情节,是指或者有清楚的时间线索, 或者有明确的人物关系第二,删掉的句子不能过多, 也就是说,留出的空儿不能太密,否则短文内容不连贯, 被试看不出应该写什么二、排句序文章是由句子组成的给被试一组句子,看他能否 将其按合理的顺序连成一段话,这也能表现他的写作能 力排句序这种题可以编成多项选择题编写这种题目 时,我们先选择一个意思相对完整的段落,这段话包含4 到6个句子(依设计的选项多少而定),然后随机地把原 来的顺序打乱,再编出正确选项和干扰选项所选的文 章应该非常连贯,也就是说,各句原来的顺序是不可改 变的,否则会使被试受到过分干扰例40.下列四个句子可以组成一段话,请找出这四句话的 正,确的排列顺序,然后在A、B、C、D四个选项中画出 代表正确顺序的字母① 我知道您是一位伟大的科学家,您的工作很忙吧?② 孙正忠爷爷:③ 我想在您的百忙中跟您谈谈我的理想。
④ 您好!A①②③④B④③②①C②④①③D②③①④三、限制性作文对于程度较高的被试,我们可以使用限制性命题作 文限制性作文的方式很多,例如,限制题材和体裁 再如,我们可以写出文章的第一段,里面规定好人物、 时间、地点、事件,让被试续写后面的部分作文的体 裁应以记叙文和应用文为主,应用文包括书信、申请书、 说明文等作为一种交际方式,记叙文和应用文是用得 最多的,也是学生首先要掌握的我们这里介绍一种限制性比较强的作文从命题角 度讲,这种题包括三个部分首先,我们要给被试设置 一个情境,例41就是设置一个询问参加汉语进修班的情 境所设置的情境应该是被试很可能接触到的,是他学 习和生活中所熟悉的第二,对文中必须写到的几项内 容做出明确的规定第三,明确规定作文的格式和字数例41.根据下列指导语的提示和要求写一封短信指导语:假设你现在正在高中学习, 马上就要放寒假了, 你想在寒假期间补习汉语你得知某学校寒假期间要开 办短期汉语进修班现在你给负责报名的李小姐写一封 信,向她了解有关情况你的信必须包括下列内容:1 .你是怎么知道汉语进修班的事儿的;2 .你为什么要参加这个班;3 .有关你自己的一些必要的信息,比如:年龄、性 别、民族、汉语学习的经验和目前的水平;4 .向对方询问有关进修班的一些情况,比如:开课 时间、人数、学费、报名地点、教材和教师等;5,其他你认为应该包括的内容。
格式要求:1,书信格式;2, 每段首句空两格;3,300字以上思考题1, 主观性试题的优点和缺点是什么?2, 设计口试题目时应注意哪些问题?3, 设计作文题目时应注意哪些问题?4,使作文题客观化的方法有哪些?第五节预测、题目分析和正式施测一、 什么是预测二、 题目参数的二重性三、 预测的要求和方式1、 被试样本2、 预测的条件3、 预测的方式4、 评分方式四、题目分析1、难易度 难度是答对率一个题的难度计算公式p=答对的人数总人数全卷的难度计算公式p=z ?^k2、区分度D=P—P二高分组答对人数一低分组答对人数一组的总人数P,二高分组答对的人数高分组的总人数Pj二低分组答对的人数低分组的总人数D值表题号高分组答对率(Pu)低分组答对率(Pi)区分度指数(D)10.70.2o.520.50.50.0 3 0.2 0.7 0.5 3、选项的分布五、 题目的修改六、 选题、组卷、施测1、选题标准难度级别难度范围所占比率极难<0.2010%较难0.21~0.4020%中等0.41~0.6040%较易0.61~0.8020%极易>0.8110%2、组卷和施测第六节测验的信度一、信度的基本概念信度也叫可靠性,就是测验分数的稳定性和一致性 程度。
1、 误差的四个来源被试测验 测验环境 评分误差2、 真分数误差分数3、三个假设X=T+E二、 相关系数1、 相关的基本概念2、 积差相关系数三、 内部一致性信度四、 影响信度的因素1、 被试的同质性2、 测验的时间限制3、 信度和题数的关系4、 信度和题目难度的关系5、 信度和区分度的关系。