第二章信息检索方法 2.1 2.1 检索的概念及原理检索的概念及原理2.2 2.2 检索工具概述检索工具概述2.3 2.3 检索方法及检索途径检索方法及检索途径2.4 2.4 检索式的拟订检索式的拟订2.5 2.5 检索步骤检索步骤 2.1 2.1 信息检索的概念信息检索的概念一、信息检索的基本概念一、信息检索的基本概念狭义:是指依据一定的方法,从已经组织好的大量狭义:是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献有关文献信息集合中,查找并获取特定的相关文献信息的过程信息的过程广义:将信息按照一定的方式组织和广义:将信息按照一定的方式组织和存储存储起来,并起来,并根据用户的需求根据用户的需求找出找出有关信息的过程有关信息的过程根据不同的检索对象):(根据不同的检索对象):一、一、数据检索:数据检索:检索的结果是数据如某种材料的电阻;某变压器的参数;化学分子式、检索的结果是数据如某种材料的电阻;某变压器的参数;化学分子式、数据图表等数据图表等(手册手册),某地方某地方GDP增长情况增长情况(年鉴年鉴)二、二、事实检索:事实检索:检索的结果是事实结论查询某一事物(事件)的性质、定义、原理以检索的结果是事实结论。
查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等如某产品是哪个厂家生产,哪个牌子的最好;及发生的时间、地点过程等如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的第一颗人造卫星是什么时候升空的(年鉴年鉴)三、三、文献检索:文献检索:检索的结果是文献资料查找相关文献的内容、出处、收藏单位等如检索的结果是文献资料查找相关文献的内容、出处、收藏单位等如系统地查找信息检索方面的相关文献系统地查找信息检索方面的相关文献(论文论文)文献检索是信息检索的一种最基本的、最主要的形式文献检索是信息检索的一种最基本的、最主要的形式检索工具是人们用来存储、报道和查找各类信息的工具v按著录信息的特征划分 著录是指编制检索工具时对文献的内容和形式特征进行分析、选择和记录的过程目录型检索工具 文摘型检索工具索引型检索工具全文型检索工具 一、检索工具的定义及类型2.2 2.2 检索工具概述检索工具概述目录能反映一定历史时期科学文化发展的概貌目录能反映一定历史时期科学文化发展的概貌作用:作用:了解本学科的研究历史和研究现状了解本学科的研究历史和研究现状通过各类书目,可查寻与研究课题密切相关的通过各类书目,可查寻与研究课题密切相关的事实和资料。
事实和资料按收录的范围可分为:馆藏目录、出版社目录、国按收录的范围可分为:馆藏目录、出版社目录、国家书目、联合目录家书目、联合目录1 1、目录型检索工具、目录型检索工具2 2、文摘型检索工具、文摘型检索工具 特点:具有摘要,提供文献的外表特特点:具有摘要,提供文献的外表特征和内容特征如:征和内容特征如:中国生物学文摘中国生物学文摘、美国美国化学文摘化学文摘 作用:作用:帮助读者快速判断文献内容,节省阅读时间帮助读者快速判断文献内容,节省阅读时间替代原文替代原文图图2-2 EI的一例文摘的一例文摘3 3、索引型检索工具、索引型检索工具 索引一般是附在专著或年鉴、百科全书等工具书索引一般是附在专著或年鉴、百科全书等工具书之后以及收录内容较多的二次文献之后,按主题词、人之后以及收录内容较多的二次文献之后,按主题词、人名、地名、事件、概念等内容要项编排,按其内容可分名、地名、事件、概念等内容要项编排,按其内容可分为主题索引、分类索引、关键词索引、引文索引为主题索引、分类索引、关键词索引、引文索引图图2-3 中国大百科全书中国大百科全书的一例索引的一例索引特点特点:提供全文下载提供全文下载4 4、全文型检索工具、全文型检索工具v按所收信息的学科内容划分按所收信息的学科内容划分:综合性检索工具综合性检索工具 我国的综合性数据库其加工深度不及专业性检我国的综合性数据库其加工深度不及专业性检索工具,检索途径少。
索工具,检索途径少专科性检索工具专科性检索工具 能够比较集中、迅速准确和全面地反映某学科能够比较集中、迅速准确和全面地反映某学科领域的最新发展状况和最前沿的科研水平详细完领域的最新发展状况和最前沿的科研水平详细完整的专业信息极具针对性整的专业信息极具针对性数据库的类型数据库的类型书目数据库全文数据库文摘数据库按信息处理层次划分期刊论文数据库书目及图书全文数据库专利数据库学位论文数据库产品数据库按收录的文献类型划分图像数据库 文本数据库数值数据库 声音数据库 视频数据库多媒体数据库按媒体信息划分综合性数据库专业性数据库按收录文献信息的范围划分单机数据库联机数据库网络数据库按服务模式划分二二 、检索工具的选择检索工具的选择v 考虑学科范围、信息类型和数据量考虑学科范围、信息类型和数据量【例题例题】用用_检索检索-呋喃甲醇羧酸酯的合成、含有碳和氢元素呋喃甲醇羧酸酯的合成、含有碳和氢元素的化合物的英文综合学术性文献的化合物的英文综合学术性文献A.A.外文外文ElsevierElsevier数据库数据库 B.B.外文农业类外文农业类CABCAB文摘数据库文摘数据库 C.C.外文农业类外文农业类AGRICOLAAGRICOLA数据库数据库 D.D.外文食品科技文摘数据库外文食品科技文摘数据库FSTAFSTAv 了解收录的文献类型了解收录的文献类型【例题例题】已知参考文献:王涛已知参考文献:王涛.土木工程土木工程CAD.CAD.中国水利水电出版中国水利水电出版社社 .2012.2012.要找原文,使用要找原文,使用_检索检索土木工程土木工程CADCAD。
A.A.中文科技期刊数据库中文科技期刊数据库 B.B.中国人民大学报刊全文数据库中国人民大学报刊全文数据库 C.C.国务院发展研究中心国务院发展研究中心 D.D.图书馆的馆藏查询图书馆的馆藏查询 信息网信息网【例题例题】使用使用检索检索CN200920135079.3CN200920135079.3一种土木连一种土木连锁建筑结构锁建筑结构A.A.维普中文科技期刊数据库维普中文科技期刊数据库 B.B.图书馆馆藏查询图书馆馆藏查询C.C.中国人民大学报刊全文数据库中国人民大学报刊全文数据库D.D.中国国家知识产权中国国家知识产权 大大 局专利数据库局专利数据库E.E.中国国家科技图书文献中心中国国家科技图书文献中心(NSTL)(NSTL)【例题例题】用用检索编号是检索编号是GB/T17302.2-1998GB/T17302.2-1998的文献的文献A.A.中国国家知识产权局中国国家知识产权局 B.B.中国国家科技图书中国国家科技图书 专利数据库专利数据库 文献中心文献中心(NSTL)(NSTL)C.C.国务院发展研究中心信息网国务院发展研究中心信息网 D.D.中国标准信息服务网中国标准信息服务网v考虑信息的时间范围考虑信息的时间范围 同一个数据库版本不同,时效性也不一定相同。
同一个数据库版本不同,时效性也不一定相同例如清华大学图书馆收藏的例如清华大学图书馆收藏的工程索引工程索引(EIEI)各种)各种载体及馆藏的简况比较:载体及馆藏的简况比较:印刷版(印刷版(EIEI)月刊,年度更新,收录文献源)月刊,年度更新,收录文献源26002600种,种,馆藏年限馆藏年限1968-19961968-1996光盘版(光盘版(Ei CompendexEi Compendex)季度更新,收录文献源)季度更新,收录文献源26002600种,馆藏年限种,馆藏年限1970197019971997年网络版(网络版(Ei CompendexWebEi CompendexWeb)包括光盘版()包括光盘版(Ei Ei CompendexCompendex)和)和Ei PageOneEi PageOne两部分,半月更新,收录文献两部分,半月更新,收录文献源源50005000种,馆藏年限种,馆藏年限19701970至今因此网络版(因此网络版(Ei CompendexWebEi CompendexWeb)信息更新最快,量最大信息更新最快,量最大2.3 2.3 检索方法及检索途径检索方法及检索途径v检索方法检索方法:1 1常规法:常规法:所谓常规法就是利用常规检索工具查找有关所谓常规法就是利用常规检索工具查找有关文献的方法文献的方法 顺查法、倒查法、抽查法顺查法、倒查法、抽查法 2 2引文法引文法 就是查找参考文献或引用文献的方法。
由远就是查找参考文献或引用文献的方法由远及近地搜寻及近地搜寻 ;由近及远地追溯由近及远地追溯 3 3综合法综合法 引文法和常规法结合引文法和常规法结合v思考:信息检索就是从一定的文献集合(即检索系统)中查找出符合特定需要的文献,那么这个过程是如何实现的呢?标引检索输出存储过程一次信息信息特征信息特征标识检索过程检索课题检索提问检索提问标识分析分析标引输入图图2-1 信息检索原理图信息检索原理图 检检 索索 结结 果果信息检索语言检索系统存储信息与检索信息所依据的规则不一致v检索途径检索途径 常用字段缩写:常用字段缩写:TITITitle Title 文章题目文章题目ABABAbstract Abstract 文章摘要文章摘要KWKWKey Word Key Word 关键词关键词AUAUAuthor Author 作者作者AFAFAffiliation Affiliation 作者单位作者单位SOSOSource Source 文章来源(刊名信息等)文章来源(刊名信息等)ISSN(ISBN)ISSN(ISBN)International standard Serial(book)Number International standard Serial(book)Number PYPYPublication year Publication year 出版年出版年LALALanguage Language 语种语种1 1、主题途径主题途径2 2、分类途径分类途径3 3、责任者责任者/刊名途径刊名途径4 4、号码途径号码途径v检索途径检索途径 主题途径是采用反映文献主题概念的主题途径是采用反映文献主题概念的检索词作为检索入口的一种检索途径检索词作为检索入口的一种检索途径,也也是最常用、最重要的检索途径。
是最常用、最重要的检索途径主题主题“是一组具有共性事物的总称,是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和用以表达文献所论述和研究的具体对象和问题问题”,即文献的,即文献的“中心内容中心内容”每种文献都包含着若干主题,研究或每种文献都包含着若干主题,研究或阐述一个或多个问题阐述一个或多个问题1 1、主题途径、主题途径 主题途径的优缺点主题途径的优缺点 通常适合特性检索,查准率高;不适合通常适合特性检索,查准率高;不适合族性检索,查全率低族性检索,查全率低【实例实例】主题词主题词“C C语言语言程序设计程序设计”就比分就比分类号类号TP312TP312表达得更准表达得更准 希望专指度高时采用主题途径希望专指度高时采用主题途径获取主题词的技巧获取主题词的技巧】在图书的版权页可以找在图书的版权页可以找到在版编目里面的主题词和分类号码或者到在版编目里面的主题词和分类号码或者在图书馆的馆藏数据找到主题词在图书馆的馆藏数据找到主题词实例实例】版权页版权页样例如右图所样例如右图所示示2 2、分类途径、分类途径(1 1)图书期刊分类法)图书期刊分类法 (2 2)专利分类法)专利分类法 (3 3)标准文献分类法)标准文献分类法(4 4)分类途径的优缺点)分类途径的优缺点(1 1)图书期刊分类法)图书期刊分类法 世界三大图书分类法:世界三大图书分类法:杜威十进分类法杜威十进分类法(DDC)(DDC)(Dewey decimal ClassificationDewey decimal Classification)国际十进分类法国际十进分类法(UDC)(UDC)(Universal Decimal Universal Decimal Classification)Classification)国会图书馆图书分类法国会图书馆图书分类法(LCC)(LCC)(Library congress Library congress classification)classification)中国图书分类法:中国图书分类法:中国图书馆分类法中国图书馆分类法(中图法)(中图法)中国科学院图书馆分类法中国科学院图书馆分类法(科图法)(科图法)中国人民大学图书馆分类法中国人民大学图书馆分类法(人大法)(人大法)中图法中图法介绍介绍中图法中图法中国图书馆分类法中国图书馆分类法,以学科来组织知,以学科来组织知识,将全部知识领域划分为识,将全部知识领域划分为5 5个基本部类,个基本部类,2222大类。
大类五大部类分别为:五大部类分别为:马列主义、毛泽东思想;马列主义、毛泽东思想;哲学;哲学;社会科学;社会科学;自然科学;自然科学;综合性图书综合性图书A 马克思主义、列宁主义 毛泽东思想、邓小平理论B 哲学、宗教C 社会科学总论D 政治、法律E 军事F 经济G 文化、科学、教育、体育 H 语言、文字I 文学J 艺术K 历史、地理N 自然科学总论O 数理科学和化学P 天文学、地球科学Q 生物科学R 医药、卫生S 农业科学T 工业技术U 交通运输V 航空、航天X 环境科学、安全科学Z 综合性图书U1 综合运输U2 铁路运输U4 公路运输U6 水路运输U8 航空运输U41 道路工程U44 桥涵工程U45 隧道工程U46 汽车工程U48 其他道路 运输工具U49 交通工程与公路 运输技术管理U441 结构原理、结构力学U442 勘测、设计与计算U443 桥梁构造U444 桥梁建筑材料U445 桥梁施工U446 桥梁试验观测与检定U447 桥梁安全与事故U448 各种桥型U449 涵洞工程图图 2-42-4 中图法中图法结构示意图结构示意图简表简表马列哲学社会科学自然科学综合基本大类基本大类详表详表T T类又可分为以下几类类又可分为以下几类 TB TB 一般工业技术 TD TD 矿业技术 TETE 石油、天然气工业 TFTF 冶金工业 TG TG 金属学、金属工艺 THTH 机械、仪表工艺 TJ TJ 武器工业 TK TK 动力工程 TLTL 原子能技术 TMTM 电工技术 TNTN 无线电电子学,电信技术 TPTP 自动化技术,计算机技术 TQ TQ 化学工业 TS TS 轻工业、手工业 TUTU 建筑科学 TVTV 水利工程 中图法中图法从大类到小类,层层展开,不断细分,从大类到小类,层层展开,不断细分,形成完整的知识体系。
形成完整的知识体系例如:例如:关于红楼梦研究资料的分类为关于红楼梦研究资料的分类为 I207.411I207.411 I I 文学文学 I2 I2 中国文学中国文学 I207 I207 文学评论和研究文学评论和研究 I207.4 I207.4 小说研究小说研究 I207.41 I207.41 古代小说研究古代小说研究 I207.411 I207.411 红楼梦红楼梦研究与评论研究与评论【例题例题】哲学辞典哲学辞典类号为:类号为:B-61【例题例题】法国的货币与银行法国的货币与银行 的类号为:的类号为:F825.65【例题例题】v在图书馆公共查询系统中检索游记小说:I267.4(2 2)专利分类法)专利分类法 专利分类法是根据专利的功能(效果)或专利分类法是根据专利的功能(效果)或其用途所属的行业部分来分类,目前,世界上其用途所属的行业部分来分类,目前,世界上大部分国家采用国际专利分类法(大部分国家采用国际专利分类法(Interna-Interna-tional Patent Classificationtional Patent Classification,简称,简称IPCIPC)国际专利分类法国际专利分类法(简称简称IPC)IPC),IPCIPC是世界上应用是世界上应用最广泛的专利分类体系最广泛的专利分类体系,覆盖了世界所有,覆盖了世界所有专专利利文献的文献的95%95%。
IPCIPC适用于适用于发明发明和和实用新型实用新型专利的分类专利的分类我国于我国于19971997年正式加入年正式加入IPCIPC联盟部部号号部名部名分部名分部名部号部号部名部名分部名分部名A人类生活必需农业E固定建筑物建筑食品;烟草钻进;采矿个人或家用物品保健;娱乐B作业;运输分离;混合F机械工程;照明;采暖;武器;爆破发动机和泵成型一般工程印刷照明;加热交通运输武器;爆破C化学;冶金化学G物理仪器冶金核子学D纺织;造纸纺织或未列入其他类的柔性材料H电学 造纸IPC分类简表 第第 2 2 讲讲 信息检索基信息检索基础础(3 3)标准文献分类法标准文献分类法 世界各国的标准分类法同文献资料分类法类似,或以数字为标记、世界各国的标准分类法同文献资料分类法类似,或以数字为标记、或以字母为标记、或以字母和数字混合为标记或以字母为标记、或以字母和数字混合为标记我国的标准分类法采用混合标记,一级类目以专业划分,用字母表我国的标准分类法采用混合标记,一级类目以专业划分,用字母表示类号,二级类目采用等级列类方法用双位制数字表示排检时先按照示类号,二级类目采用等级列类方法用双位制数字表示排检时先按照字母顺序,大类相同再按双位数字顺序排列。
中国标准分类法字母顺序,大类相同再按双位数字顺序排列中国标准分类法(Chinese Classification for StandardsChinese Classification for Standards,简称,简称CCSCCS)【部分分类部分分类】A 综合0009 标准化管理与一般规定1019 经济、文化2039 基础标准4049 基础学科5064 计量6574 标准物质7579 测绘B 农业林业0009 农业、林业综合1014 土壤与肥料1519 植物保护2029 粮食与饲料作物3039 经济作物4049 畜牧5059 水产、渔业(4 4)分类途径的特点)分类途径的特点1 1)通常适合族性检索,查全率高;不适合特)通常适合族性检索,查全率高;不适合特性检索,查准率低性检索,查准率低2 2)不能适应学科发展中的变化,难以反映新)不能适应学科发展中的变化,难以反映新学科和新名词术语学科和新名词术语 【实例实例】食品风险分析是保证食品安全的一种食品风险分析是保证食品安全的一种新模式,同时也是一门正在发展中的新兴学新模式,同时也是一门正在发展中的新兴学科风险分析的目标在于保护消费者的健康科。
风险分析的目标在于保护消费者的健康和促进公平的食品贸易目前的文章在分类和促进公平的食品贸易目前的文章在分类上暂时归入上暂时归入 R155.5 R155.5 食品卫生与检验和食品卫生与检验和 TS201.6 TS201.6 食品安全与卫生没有一个专食品安全与卫生没有一个专门的门的“食品风险分析食品风险分析”分类号英文版著者索引中人名规则英文版著者索引中人名规则 按姓、名次序排列:一般为原文中所使用的名字,按姓、名次序排列:一般为原文中所使用的名字,姓在前,接着是逗号,然后是名姓在前,接着是逗号,然后是名例如:例如:Arrow B.Smith 著录为:著录为:Smith,Arrow B.3 3、责任者、责任者/刊名途径刊名途径作者无疑是最佳检索途径之一欧美人的姓名大量使用简称,作者无疑是最佳检索途径之一欧美人的姓名大量使用简称,姓氏一般用全称,而名则以简写居多姓氏一般用全称,而名则以简写居多例如例如:v以著名物理学家史蒂芬以著名物理学家史蒂芬威廉威廉霍金霍金(Stephen William(Stephen William Hawking)Hawking)为例,在为例,在Google ScholarGoogle Scholar中检索输入中检索输入“SW HawkingSW Hawking”较较“Stephen William HawkingStephen William Hawking”检索效果更为理想。
检索效果更为理想v同样万维网之父蒂姆同样万维网之父蒂姆伯纳斯伯纳斯李的名字除输入李的名字除输入“Tim Tim BernersBernersLeeLee”外,还应输入外,还应输入“T BernersT BernersLeeLee”或是或是“T B T B LeeLee”v若无法确定作者准确姓名,可仅输入作者的姓氏如若无法确定作者准确姓名,可仅输入作者的姓氏如20072007年年诺贝尔经济学奖获奖者之一莱昂尼德诺贝尔经济学奖获奖者之一莱昂尼德赫维奇赫维奇(Leonid(Leonid Hurwicz)Hurwicz)在Google ScholarGoogle Scholar中仅输入中仅输入“HurwiczHurwicz”,其查准,其查准率、查全率也是非常高的率、查全率也是非常高的翻译为英文的中国著者姓名翻译为英文的中国著者姓名(1 1)翻译的规则)翻译的规则分为音译和意译中国著者姓名和团体机构名称的音译,一般分为音译和意译中国著者姓名和团体机构名称的音译,一般用汉语拼音用汉语拼音实例实例】原西南师范大学在欧洲专利数据库就有三种写法:原西南师范大学在欧洲专利数据库就有三种写法:Southwest China Normal University Southwest China Normal University Southwest Normal University Southwest Normal University Xinan Teachers,University Xinan Teachers,University有的数据库例如有的数据库例如工程索引工程索引常将常将UniversityUniversity缩写成缩写成UnivUniv。
中国人名翻译成英文名字基本上是用汉语拼音中国人名翻译成英文名字基本上是用汉语拼音v以杨振宁为例,可输入以杨振宁为例,可输入“Yang ZhenningYang Zhenning”或或输入输入“Zhen Ning YangZhen Ning Yang”,以输入,以输入“CN YangCN Yang”命中的文献最多命中的文献最多v同样,要查询李政道的文献,可分别输入同样,要查询李政道的文献,可分别输入“TD LeeTD Lee”、“Tsung Dao LeeTsung Dao Lee”、“li li zhengdaozhengdao”v刊名也是有效的检索途径之一,并大量使用刊名也是有效的检索途径之一,并大量使用缩略语IEEEIEEE系列期刊的刊名均为系列期刊的刊名均为“IEEE IEEE Transactions on Transactions on ”v以以IEEE Transactions on SystemsIEEE Transactions on Systems为例,仅为例,仅输入其全称是不够的,还应输入输入其全称是不够的,还应输入“IEEE IEEE TransTransSystSyst”。
v以以“Knowledge and Information Systems Knowledge and Information Systems”一刊为例,除输入全称外,还需输入一刊为例,除输入全称外,还需输入“know1know1infinfsystsyst”2 2)拼写形式)拼写形式【例题例题】在英文数据库检索作者在英文数据库检索作者“金长青金长青”的论文,作者名除的论文,作者名除了了“Jin,ChangQingJin,ChangQing”还有其他拼写形式?还有其他拼写形式?【题解题解】ChangQing Jin ChangQing Jin Jin,Chang-Qing Jin,Chang-Qing Jin CQ Jin CQ CQ CQ,JinJin Jin,C.Q Jin,C.Q Jin,C.Q.Jin,C.Q.Jin,C.-Q Jin,C.-Q4 4、号码途径号码途径 常见的号码索引:常见的号码索引:ISBNISBN号、索书号、号、索书号、ISSNISSN号、专利号、入藏号、报告号、标准编号号、专利号、入藏号、报告号、标准编号常见的专用符号代码索引:常见的专用符号代码索引:元素符号、分子式、结构式等元素符号、分子式、结构式等常见的专用名词术语索引常见的专用名词术语索引地名、机构名、商品名、生物属名等地名、机构名、商品名、生物属名等 种次号种次号中图分类号中图分类号 2.4 2.4 检索式的拟订检索式的拟订2.4.12.4.1布尔逻辑检索算符布尔逻辑检索算符 2.4.22.4.2位置检索算符位置检索算符2.4.32.4.3截词检索算符截词检索算符2.4.42.4.4字段揭示及限制算符字段揭示及限制算符2.4.52.4.5其它符号其它符号2.4.62.4.6注意事项注意事项精确与模糊检索精确与模糊检索 基本技术基本技术词间位置检索词间位置检索 加权检索加权检索 布尔逻辑检索布尔逻辑检索 限定字段检索限定字段检索 限定范围检索限定范围检索 截词检索截词检索 1.1.逻辑逻辑 “与与”(AND)(AND),表示为,表示为 A and B A and B 或或 A A*B B 2.2.逻辑逻辑 “或或”(OR)(OR),表示为,表示为 A or B A or B 或或 A+B A+B 3.3.逻辑逻辑 “非非”(NOT)(NOT),表示为,表示为 A not B A not B 或或 A-BA-B 2.4.1 2.4.1 布尔逻辑检索算符布尔逻辑检索算符 逻辑逻辑“与与”用“and”、“*”或者空格表示。
在网络搜索引擎中习惯用空格代替“and”表示检出的记录必须同时包含所有的检索词,可以缩小检索范围,减少命中文献量,提高查准率ABA and B例:检索例:检索“太阳能太阳能”文献文献太阳太阳能源能源 【实例实例】检索课题检索课题“前视红外图像分割方前视红外图像分割方法研究法研究”【实例实例】检索课题检索课题“中国外汇储备规模的中国外汇储备规模的研究研究”逻辑逻辑“或或”用“or”、“”或逗号表示在网络搜索引擎中习惯用逗号代替“OR”表示检出的记录中至少含有多个检索词中的任何一个,可以扩大检索范围,增加命中文献量,防止漏检常用于连接同义词,相关词等ABA or B例:检索例:检索“光盘和磁盘光盘和磁盘”文献文献光盘光盘磁盘磁盘【实例实例】在搜索引擎中输入在搜索引擎中输入“计算机计算机OROR多多媒体媒体OR Windows98OR Windows98”则查询至少包含则查询至少包含“计计算机算机”、“多媒体多媒体”、“Windows 98Windows 98”三三者之一的信息者之一的信息逻辑逻辑“非非”(NOT)(NOT)表示检索结果中排除含有某些词的记录,可以缩小检索范围,减少文献输出量,但并不一定能提高查准率。
ABA not B例:检索例:检索“除核能以外有关能源除核能以外有关能源”文献文献能源能源核能核能【实例实例】输入:输入:automobile not carautomobile not car,就,就要求查询的结果中包含要求查询的结果中包含automobileautomobile(汽(汽车),但同时不能包含车),但同时不能包含carcar(小汽车)小汽车)实例实例】在搜索引擎中输入:电视台在搜索引擎中输入:电视台-中央中央电视台,查询结果不包含电视台,查询结果不包含“中央电视中央电视台台”相同的检索词在不同的字段中检索到的结果不同相同的检索词在不同的字段中检索到的结果不同实例实例】用用中文科技期刊数据库中文科技期刊数据库检索机械产品采用计算机检索机械产品采用计算机辅助设计的论文辅助设计的论文用不同字段作为途径,如下所示:用不同字段作为途径,如下所示:选择选择”u=u=任意字段任意字段”输入输入“计算机辅助计算机辅助*产品产品”,查出,查出30903090篇;篇;选择选择”m=m=题名或关键词题名或关键词”输入输入“计算机辅助计算机辅助*产品产品”,查出,查出665665篇;篇;选择选择“t=t=题名题名”输入输入“计算机辅助计算机辅助*产品产品”,查出,查出149149篇;篇;选择选择“k=k=关键词关键词”输入输入“计算机辅助计算机辅助*产品产品”,查出,查出576576篇;篇;检索入口检索入口 选择选择“c=c=分类号分类号”输入输入“机械产品机械产品”的分类号的分类号“TH122TH122”年限设定,查到年限设定,查到1237912379条。
条也叫也叫邻接检索邻接检索”,表示两个或多个检索词之间的关表示两个或多个检索词之间的关系检索方式,常用的位置算符有系检索方式,常用的位置算符有:1.w(with)1.w(with)表示两个检索词前后次序固定,二者之间只能间隔连表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或者是逗号字符、空格或者是逗号实例实例】在在OCLCOCLC中输入中输入communication w satellitecommunication w satellite;2 2.wN(with N)wN(with N)表示两个检索词前后次序固定,二者之间最多间隔表示两个检索词前后次序固定,二者之间最多间隔N N个个字符实例实例】在在EBSCOEBSCO中输入中输入communication w3 satellitecommunication w3 satellite;3.n(Near)3.n(Near)表示两个检索词可以互换顺序,表示两个检索词可以互换顺序,二者之间只能间隔连字符、空格或者是逗二者之间只能间隔连字符、空格或者是逗号实例实例】在在OCLCOCLC中输入中输入communication n communication n satellitesatellite;4.nN(Near N)4.nN(Near N)表示两个检索词可以互换表示两个检索词可以互换顺序,二者之间最多间隔顺序,二者之间最多间隔N N个字符。
个字符实例实例】在在EBSCOEBSCO中输入中输入communication n3 communication n3 satellite;satellite;比较:在比较:在EBSCOEBSCO中输入中输入source and lawsource and law、source w2 lawsource w2 law又称精确检索又称精确检索 1.1.机构名称机构名称 如:如:The World Intellectual Property OrganizationThe World Intellectual Property Organization 2.2.人名人名 如:如:George W.WashingtonGeorge W.Washington 3.3.地名地名 如:如:San FranciscoSan Francisco 4.4.专用名称专用名称 如如 i information retrievalnformation retrieval 中文数据库选择:精确检索中文数据库选择:精确检索 外文数据库采用:双引号外文数据库采用:双引号2.4.2.4.4 4 截词检索算符截词检索算符v检索检索colorcolorv检索检索computercomputer、microcomputermicrocomputer、minicomputerminicomputerv英语词根英语词根ologyology 截词符(通配符)截词符(通配符)提高查全率,防止漏提高查全率,防止漏检的有力手段,也可以简化输入,包括有限截词检的有力手段,也可以简化输入,包括有限截词和无限截词,常用的截词符有:和无限截词,常用的截词符有:*,?,#,!,?,#,!,$有限截词有限截词一个符号表示一个字符,一般使用一个符号表示一个字符,一般使用“?”(英文半角问号)代表(英文半角问号)代表0-10-1个字符。
个字符比如比如:chip?:chip?可检索出:可检索出:chipschips(右截断)(右截断)无限截词无限截词一个符号表示任意多个字符,标准符号一个符号表示任意多个字符,标准符号是是“*”,代表,代表0-n0-n个字符,也称为通配符个字符,也称为通配符比如比如:comput:comput*可检出:可检出:compute,Computer,compute,Computer,computers,computing,Computerizecomputers,computing,Computerize等等.注:不同的数据库所用的截词符不一样,使用应先查注:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认一下各数据库的帮助加以确认2.4.2.4.4 4 截词检索算符截词检索算符后截断无限截断无限截断如:physic?截词检索与截词检索算符PhysicphysicsphysicstphysicalismPhysicphysicsphysicst如:physic*有限截断有限截断中截断中截断前截断前截断m?nmanmenvOnelook(词典)例如:查找后缀为:ologyvTitle(ti)=computervPy=2008vLa=englishv限定网站:site: link:whitehouse.govv限定网页:inurl:flash 小苹果v限定文件类型:filetype:ppt 通信 2.4.2.4.5 5 字段限制检索字段限制检索2.4.2.4.6 6 其它符号其它符号1 1括号括号 括在其中的操作符先起作用。
括在其中的操作符先起作用三聚氰胺三聚氰胺*(农产品农产品 +鸡蛋鸡蛋+牛奶牛奶 +大米大米)2 2个别数据库使用的特殊符号个别数据库使用的特殊符号 某些搜索引擎使用加号(某些搜索引擎使用加号(+)表示该单词必须出现表示该单词必须出现在某些搜索引擎中输入在某些搜索引擎中输入“+电脑电脑++”就表示要查找的内容必就表示要查找的内容必须要同时包含须要同时包含“电脑、、电脑、、”这三个关键词这三个关键词个别数据库例如个别数据库例如“国研网国研网”、山东标准网使用、山东标准网使用“&”代替代替“andand”;欧;欧洲专利局光盘数据库的洲专利局光盘数据库的“withoutwithout”、美国专利商标局数据库的、美国专利商标局数据库的“andnotandnot”就是通用的就是通用的“notnot”4.4.英语或汉语中都有许多虚词,不能作为检索词英语或汉语中都有许多虚词,不能作为检索词如:汉语中如:汉语中“的、地、得、了的、地、得、了”等助词等助词;英语中的英语中的a about also and any as at be a about also and any as at be between by both for some so not this withbetween by both for some so not this with等等介词或冠词等介词或冠词等思考:比较3个检索式检索结果的不同v“Information retrieval”/Ti vInformation AND retrieval/Ti vInformation(n)retrieval/Tiv不仅要求在题名字段中不仅要求在题名字段中,而且是短语而且是短语v只要求在题名字段中,而不严格限制它们是短语,如只要求在题名字段中,而不严格限制它们是短语,如“information organization methods for effective retrieval”v要求在题名字段中,还要求两者之间不能有其他词要求在题名字段中,还要求两者之间不能有其他词2.5 2.5 检索步骤检索步骤1 1分析课题分析课题 2 2检索策略检索策略 选择合适的检索工具选择合适的检索工具 选择检索途径选择检索途径 拟订检索式拟订检索式3 3实施检索实施检索4 4筛选文献筛选文献5 5索取原文索取原文 1.1.弄清课题学科属性、专业范围及其弄清课题学科属性、专业范围及其相关内容相关内容 课题是单一学科还是涉及多学科课题是单一学科还是涉及多学科或跨学科。
或跨学科当课题涉及多学科时,以主要学当课题涉及多学科时,以主要学科为检索重点,次要学科为补充科为检索重点,次要学科为补充例:超声波技术在医学上的应用例:超声波技术在医学上的应用2.2.弄清检索课题的信息类型和时间要求弄清检索课题的信息类型和时间要求 时间要求上,研究层次低、学科发展快的,则检索的时段时间要求上,研究层次低、学科发展快的,则检索的时段可以适当缩短可以适当缩短例如:查例如:查“超声波技术的应用超声波技术的应用”和查国内外研究社会保障制度和查国内外研究社会保障制度的文章3.3.考虑课题的特殊要求考虑课题的特殊要求4.4.明确检索者自身的信息需求明确检索者自身的信息需求 检索策略是对检索的全面策划,在操作上检索策略是对检索的全面策划,在操作上主要指检索式的编制和数据库、检索途径的选主要指检索式的编制和数据库、检索途径的选择正确的检索策略可以优化检索过程,以最正确的检索策略可以优化检索过程,以最小的花费、最短的时间获得最佳的检索效果小的花费、最短的时间获得最佳的检索效果2.5.2 2.5.2 检索策略检索策略1.1.确定检索词、检索式确定检索词、检索式切分:是对课题的语句以词为单位进行切切分:是对课题的语句以词为单位进行切分,转换为检索的最小单元。
分,转换为检索的最小单元例:检索例:检索“吸烟与肺癌的关系研究吸烟与肺癌的关系研究”相关文献相关文献例:检索例:检索“肺气肿病人的血氧测定法肺气肿病人的血氧测定法”方面的方面的相关文献相关文献注意:应保持词意义的完整注意:应保持词意义的完整删除:对不具有检索意思的虚词或过分宽删除:对不具有检索意思的虚词或过分宽泛的限定词应予以删除泛的限定词应予以删除替换:是对表达不清晰或容易造成检索误差替换:是对表达不清晰或容易造成检索误差的词用更明确、更具体的词予以替换如公的词用更明确、更具体的词予以替换如公交交 公共交通,绿色包装公共交通,绿色包装-环保包装等环保包装等增加:针对一词多义或者在检索结果中有很增加:针对一词多义或者在检索结果中有很多干扰信息时,可采用增加检索词达到多干扰信息时,可采用增加检索词达到“限限义义”的手段例:神经网络在旋转机械故障诊断中的应用研究例:神经网络在旋转机械故障诊断中的应用研究 1.1.本课题包含本课题包含“神经网络神经网络”“旋转机械旋转机械”“故障诊断故障诊断”三个概念三个概念,“应用应用”和和“研究研究”属于意义过于宽泛的词,不应属于意义过于宽泛的词,不应该作为检索词。
该作为检索词2.2.扩展扩展 神经网络:相关的上位词有人工智能神经网络:相关的上位词有人工智能旋转机械旋转机械故障诊断:相关词有故障定位、故障检测,上位词有故障诊断:相关词有故障定位、故障检测,上位词有容错技术容错技术 3.3.检索式:检索式:(神经网络(神经网络 OR OR 人工智能)人工智能)ANDAND(旋转机械)(旋转机械)AND(AND(故障诊断故障诊断 OR OR 故障定位故障定位 OR OR 故障检测故障检测 OR OR 容错技术)容错技术)2.2.确定检索途径确定检索途径 已知文献的外部特征,尽量使用该已知文献的外部特征,尽量使用该外部特征进行检索;文献的外部特征未外部特征进行检索;文献的外部特征未知,则通常采用内容特征进行检索知,则通常采用内容特征进行检索采用内容特征:希望泛指度高时选采用内容特征:希望泛指度高时选择分类途径,希望专指度高时采用主题择分类途径,希望专指度高时采用主题途径要从概念入手,而不是从字面意思入手;要从概念入手,而不是从字面意思入手;.概念扩展时要考虑同义词、相关词、上位词概念扩展时要考虑同义词、相关词、上位词/下位词等下位词等(既词表中提到的用、代、分、属、参、族),还要注意中英文既词表中提到的用、代、分、属、参、族),还要注意中英文混用的现象混用的现象 ;3.3.当课题比较生疏时,应当首先利用百科全书、图书等弄清当课题比较生疏时,应当首先利用百科全书、图书等弄清楚概念,了解课题的有关专业知识,弄清楚课楚概念,了解课题的有关专业知识,弄清楚课 题的内容和要解决题的内容和要解决的问题以及解决该问题的初步设想等,进而确定检索的主题范围。
的问题以及解决该问题的初步设想等,进而确定检索的主题范围4.4.人文社会科学的检索,如果是回溯检索,应该熟悉不同年人文社会科学的检索,如果是回溯检索,应该熟悉不同年代所使用的概念和术语代所使用的概念和术语 5.5.忽略那些意义过于宽泛、通用的词,比如忽略那些意义过于宽泛、通用的词,比如:“研究研究”、“应用应用”、“探讨探讨”等须注意的问题:须注意的问题:示示 例例1.1.检索关于研究鲁迅的论文,应选择什么检索字段检索关于研究鲁迅的论文,应选择什么检索字段题解题解】必须选择标题或者关键词,必须选择标题或者关键词,不能选择为作者途径不能选择为作者途径2.2.用用中文科技期刊数据库中文科技期刊数据库检索胡鞍钢在检索胡鞍钢在公共管理学公共管理学报报 上面发表的论文上面发表的论文题解题解】A=A=胡鞍钢胡鞍钢*J=J=公共管理学报公共管理学报 3.3.写出写出“研究法律与经济和政治的关系研究法律与经济和政治的关系“的课题的检索式的课题的检索式题解题解】法律法律*(经济(经济+政治)政治)4.4.检索有关检索有关“中国国内商业银行的信贷管理或信贷风险的中国国内商业银行的信贷管理或信贷风险的研究研究”方面的相关文献。
方面的相关文献题解题解】(商业银行(商业银行-外资银行)外资银行)*(信贷管理(信贷管理+信贷风险)信贷风险)v查找华中科技大学罗俊院士1999年以来发表的文章?AU=Luo Jun AND(AF=Huazhong Univ*)AND PY=1999v查找2002年出版或发表的关于克隆人立法方面的英文著作或论文The legislation of human cloning”or human clone and legislat*and LA=English and PY=2002 选择数据库要考虑以下因素:选择数据库要考虑以下因素:1.1.检索目的:检索的学科范围、地区范围、语种范围、检索目的:检索的学科范围、地区范围、语种范围、时间范围、文献类型,检索深度为题录、文摘还是全文时间范围、文献类型,检索深度为题录、文摘还是全文等等等等2.2.检索结果:对于研究生做学位论文来说,做课题前应检索结果:对于研究生做学位论文来说,做课题前应充分了解一下本课题国内外的研究现状(即论文的综述充分了解一下本课题国内外的研究现状(即论文的综述部分),这时应对该课题进行较全面的检索,包括综述部分),这时应对该课题进行较全面的检索,包括综述性的文章,要求全面;对于该课题的核心部分,即该课性的文章,要求全面;对于该课题的核心部分,即该课题所要解决的具体问题,创新的地方,则需要准,技术题所要解决的具体问题,创新的地方,则需要准,技术细节越细越好。
细节越细越好3.3.检索内容所属学科检索内容所属学科,对与自己相关的数据库要有一个对与自己相关的数据库要有一个全面的了解全面的了解.2.5.4 2.5.4 筛选文献筛选文献 应当根据课题的科学技术要点,将检索应当根据课题的科学技术要点,将检索结果分为密切相关文献和一般相关文献对结果分为密切相关文献和一般相关文献对相关文献情况及对相关文献的主要论点进行相关文献情况及对相关文献的主要论点进行对比分析对比分析1 1网上下载原文网上下载原文2 2就近借阅就近借阅3 3文献传递文献传递 【例题例题】华中科技大学学生已知一些理工科类大学学华中科技大学学生已知一些理工科类大学学位论文题目,如何获得原文?位论文题目,如何获得原文?【题解题解】方法方法1:1:使用华中科技大学图书馆的馆藏目录查询到图书形式的使用华中科技大学图书馆的馆藏目录查询到图书形式的学位论文,直接借阅:学位论文,直接借阅:方法方法2 2:使用图书馆购买的学位论文数据库检索,可以直接查:使用图书馆购买的学位论文数据库检索,可以直接查看近年来的原文看近年来的原文方法方法3 3:本地没有的则通过网上检索得到题目后,再从高校图:本地没有的则通过网上检索得到题目后,再从高校图书馆、国家科技图书文献中心(书馆、国家科技图书文献中心(NSTLNSTL)通过馆际互借寻找全)通过馆际互借寻找全文,收费较低,时差也短。
文,收费较低,时差也短方法方法4 4:外文图书可以通过:外文图书可以通过OCLCOCLC获取检索效率检索效率 查全率和查准率是判定检索效果的主要指查全率和查准率是判定检索效果的主要指标查全率查全率:(Recall RatioRecall Ratio)指系统在进行某一检索指系统在进行某一检索时,检索出的相关文献量与系统文献库中相关文时,检索出的相关文献量与系统文献库中相关文献总量的比率用公式表示为:献总量的比率用公式表示为:检出的相关文献量检出的相关文献量 系统数据库中的相关文献总量系统数据库中的相关文献总量 R=X100%扩大检索范围扩大检索范围,提高查全率的方法提高查全率的方法1 1、跨库检索、跨库检索2 2、选择较大检索范围的字段如摘要、选择较大检索范围的字段如摘要3 3、外文单词使用截词符、外文单词使用截词符4 4、使用上位词(如飞行器、使用上位词(如飞行器 _航天飞机航天飞机 _载载人航天飞机)人航天飞机)5 5、考虑同义词或近义词(使用布尔逻辑符、考虑同义词或近义词(使用布尔逻辑符oror连接)连接)6 6、逐步扩大算符的检索范围,逐步提高查全率的算、逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符符依次是:位置算符w w wn wnnear near 逻辑算符逻辑算符and and or or 查准率查准率:(Precision RatioPrecision Ratio)指系统在进行某)指系统在进行某一检索时,检出的相关文献量与检出文献总一检索时,检出的相关文献量与检出文献总量的比率。
用公式表示为:量的比率用公式表示为:检出的相关文献量检出的相关文献量 检出的文献总量检出的文献总量 P=X100%缩小检索范围,提高查准率的方法缩小检索范围,提高查准率的方法1 1、选择专业性检索工具如使用产品数据库、特种搜、选择专业性检索工具如使用产品数据库、特种搜索引擎2 2、选择检索范围较小的字段、选择检索范围较小的字段3 3、逐步缩小算符的检索范围,逐步提高查准率的算、逐步缩小算符的检索范围,逐步提高查准率的算符依次是:符依次是:逻辑算符逻辑算符or or and and 位置算符位置算符nearnear wn wn w w;使用算符;使用算符notnot排除干扰信息排除干扰信息4 4、使用二次检索、使用二次检索5 5、使用下位词、使用下位词OCLC检索结果EBSCO检索结果OCLC检索结果EBSCO检索结果EBSCO检索结果EBSCO检索结果Thank You!。