成语大全网 - 汉语词典 - 2009年奥赛和华赛

2009年奥赛和华赛

第一章 绪论

一、文献的概念

1.文献的定义为“记录有知识的一切载体”。

2.文献的四要素:知识内容、信息符号、载体材料和记录方式。

二、文献的类型

1.按照加工深度区分

1)零次文献:最原始,如:私人笔记、手稿等。

2)一次文献(原始文献):产生二、三次文献的基础,检索利用的对象,如:论文、报告等。内容新颖丰富,叙述具体详尽,数量庞大、分散。

3)二次文献:一次文献的检索工具,如:目录、题录、文摘等。

4)三次文献:一次文献内容的高度浓缩和再出版,如:年鉴、手册、词典等。

**从一次文献到三次文献,在内容上体现了从分散化到系统化、密集化的过程。

2.按照载体的物理形态区分

1)印刷型:纸质型。最基本的文献形式。

2)缩微型:非纸质型。

3)声像型:非纸质型。

4)电子型:非纸质型。文献的发展方向。

3.按照内容特点和出版方式区分(一次文献)

1)图书

a.内容特点:比较成熟,系统全面,基本知识

b.标准著录格式:

作者.总书名.版本(第1版不写).出版地:出版者,出版年,页码.

c.判别依据:出版地:出版者

d.实际情况:版次 second edition,3rd edition;编者 ed.;ISBN号;出版商:

press,,publisher,publishing company等。

e.例:Bain J S.Barriers to New Competition.Cambridge:Harvard University Press,1956.

2)期刊

a.定义:连续出版物

b.内容特点:新颖

c.标准著录格式:

期刊:作者.文章篇名.刊名,出版年,卷号,期号,起止页码

判别依据:刊名,卷号,期号

报纸:作者.文章篇名.报纸名,出版日-月-年,版次

d.例:Brown C.The Effect of the Minimum Wage on Employment and Unemployment.The Journal of Economic Literature,1982,vol.20,no.2,489-490.(OR:J. Econ. Lit.,1982,20(2):489-490)

3)会议文献

a.内容特点:学术性强,新颖,质量较高

b.标准著录格式:

作者.文章篇名.会议文集名,会址,开会年.(会议文集出版地:出版者),出版年,起止页码

c.判断依据:有表示会议的词,如:conference,symposium,workshop,meeting。

d.有时有表示会议录的词,如:Proceedings of,Collection of。

e.并非含有“出版地:出版社”的文献都是图书。当既含有表示会议的词又含有“出版地:出版社”时,应判断为会议文献。

4)报告

a.内容特点:新颖,专深,详尽,可靠

b.标准著录格式:

作者姓名.文章篇名.报告号,完成报告的机构名,所在地,出版年份.

c.判别依据:表示报告的词,如:report(rep.),memorandum;

报告号(机构代码+顺序号),如:R-3204/2。

5)专利

a.内容特点:具体,有附图,适合于产品设计

b.标准著录格式:发明人.发明题名.专利号,出版日期,申请日期

c.判别依据:有表示专利的词(patent)和专利号(2位的国别或地区代码),如:US,5,223,885。

6)标准文献

a.内容特点:权威,技术规定

b.标准著录格式:标准颁布机构.标准题名.标准号

c.判别依据:标准颁布机构中含表示标准的词,如:standard,recommendation。

标准号(机构代码、顺序号、颁布年份),如:ANSI TI-601-1988。

7)学位论文

a.内容特点:质量参差不齐,独创性,偏理论,重实践。不公开出版。

b.标准著录格式:作者姓名.论文篇名.学位级别及表示学位论文的词,授予学位机构名,授予年份.

c.判别依据:有表示学位论文的词,如:thesis,dissertation。

8)档案:不公开。

9)政府出版物:科学技术和社会经济方面的文献。

**文后参考文献的一般格式(三要素):作者姓名.文献篇名.来源出处

**特种文献

1)报告:报告号:report(rep.)+机构代码+顺序号

2)专利:专利号:两位国家(地区)代码+顺序号

3)标准:标准号:标准机构代码+顺序号+年份

4.按照出版周期和内容特点区分(电子文献)

1)电子图书

2)电子期刊

3)动态电子信息

三、文献的分布

1.文献信息资源的分布(除政府出版物外的八种文献)

1)国家专利局以及各地的相应机构:专利。

2)国家技术监督局以及各地的相应机构:标准。

3)国家档案局以及各地的相应机构:档案。

4)国家图书馆、中国科技信息研究所和学位授予单位(图书馆和档案馆):学位论文。

5)国家文献信息系统(包括:科技信息系统,社会科学院图书馆系统,高校图书馆系统,公***图书馆系统):图书、期刊、会议录和报告。

2.不同类型文献的出版时间分布规律

1)学位论文

2)会议、报告、专利和期刊(多)。

3)目录、题录和文摘。

4)综述和百科全书。

**信息利用者的观点

1)查找一两个月之内的信息:互联网以及当前最新的报纸杂志、广播电视。

2)查找两个月之前到十年之内的信息:网上图书期刊类的数据库。

3)5~20年前的信息:期刊和纸质版的图书和手册性工具书。

3.文献信息的学科分布规律——核心期刊

1)众多的文献类型中只有期刊论文分布符合一定的规律。

2)概念:布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。

3)属性:经过专门机构研究认定的某一学科中水平和影响力较高的期刊。

4)特性:学科性,学术性,时间性。

a.学科性:核心期刊只针对某一学科,学科不同,核心期刊不同。

b.学术性:期刊的影响因子(Impact Factor, 简称IF):某一种期刊在第三年得到的前两年发文的引文数与该刊前两年的总论文数之比。

c.时间性:核心期刊不是固定不变的,每隔几年重新认定。

5)阅读核心期刊是一种有效的信息获取方法。

6)国内核心期刊:北京大学《中文核心期刊要目总览》;南京大学《中文社会科学引文索引》(CSSCI);中国社会科学院《中国人文社会科学核心期刊要览》。

7)国外核心期刊:美国《社会科学引文索引》(SSCI)。

第二章 文献信息检索原理和方法

§2.1 信息检索的基本概念

一、信息检索的类型

1.以检索内容区分

1)文献检索:相关性检索,以文献为检索对象。

2)数据检索(数值检索):确定性检索,以数值或图表为检索对象。

3)事实检索:确定性检索,以事实、概念、思想及一些数据信息为检索对象。

2.以检索方式区分

1)手工检索:回溯查找的年份不受限制,效率低、漏检率高。

2)计算机检索:速度快、效率高、查全率高,成本高、回溯年份有限。

二、信息检索系统的类型(以报道文献的内容层次区分)

1.目录

1)报道文献出版或收藏信息。

2)报道单位:本、种、件。

3)揭示文献内容的深度:出版物名称为止。

2.题录

1)按一定的排检方法编排图书、报刊等中论文的篇目,供人们查找篇目出处。

2)报道单位:篇。

3)揭示文献内容的深度:至篇名为止。

3.文摘

1)以精练的语言摘录文献信息的重要内容、学术观点、数据、结构,并按一定的著录规则与排列方式编排,供读者查阅使用。

2)报道单位:篇。

3)揭示文献内容的深度:至摘要为止。

4.全文

1)全文系统的主体内容是文献的全文。

2)报道单位:篇。

3)揭示文献内容的深度:至全文为止。

**索引:通常依附于目录、题录、文摘等纸质型检索工具之后,不独立存在。

三、信息检索数据库的构成(从使用者观点观察)

1.文档:一个数据库至少包括顺排档和倒排档两种文档。

1)顺排档(主文档):按记录存取号的大小顺序排列。存入的越晚顺序号越大。

2)倒排档:按一定顺序(字母或数字顺序)排列记录中各字段数据内容。

2.记录:有关文献或数据的整体描述,构成数据库或文档的基本单元。

1)在全文数据库中,一条记录相当于一篇文章。

2)在书目数据库中,一条记录相当于一条文摘或题录。

3.字段:记录的基本单元。是对实体的具体属性进行描述的结果。

1)基本字段:题目(TI),文摘(AB),叙词(DE),关键词(KW)。

2)辅助字段:作者(AU),作者单位(AF),期刊名称(ST),语种(LA)。

四、信息检索方法的类型

1.按照检索系统使用与否区分

1)直接检索法:直接浏览报刊杂志获取所需信息。优点:获得最新信息。

2)间接检索法:通过检索工具的指引进行查找获取所需信息。优点:以较少的时间、较好的途径获得需要的检索效果。

2.按照所使用的检索系统区分

1)追溯法:从已有文献后面所附的参考文献入手,逐一追查原文,再从这些原文后所列参考文献逐一追查,不断扩大检索线索,获得相关文献。缺点:费时,易漏检、误检。

2)常用法(工具法):利用目录、题录、文摘、全文或相应的数据库等检索系统查找文献。目前最常用。

3)综合法(循环法或交替法):综合使用追溯法和常用法。全面而准确。

3.按照检索文献的时间顺序区分

1)顺查法:由远及近。优点:系统全面,基本上可反映某学科专业或某课题发展的全貌。

2)倒查法:由近及远。多用于查找新课题或有新内容的老课题。优点:有时可保证信息新颖。缺点:易于漏检而影响查全率。

3)抽查法:利用学科发展的波浪式特点,针对发展高潮进行抽查。针对性强、省时,但须熟悉学科发展阶段。

五、文献信息的一般检索步骤

1.分析研究课题,明确检索要求。

2.选择检索工具或检索系统(根据检索目的、需求内容、数据库记录来源等)

3.确定检索途径

4.记录和阅读文献线索

5.索取原始文献

**检索途径:检索途径即开始查找的入口点。

1)分类途径:利用目次表或分类索引进行检索。关键是确定分类类目或分类号。常用于学科和专利文献普查。

2)主题途径:利用主题索引进行检索。关键是确定主题词或关键词。

3)著者途径:利用著者索引进行检索。关键是要书写准确著者的姓名。

4)序号途径:利用代码索引进行检索。一般有专利号索引、标准号索引等。

六、检索效果评价

1.检索效果:检索结果的有效程度

2.常用评价指标:收录范围、查全率、查准率、响应时间、用户负担和输出形式等。其中主要的指标是查全率和查准率。

3.查全率(检全率、命中率):检出的相关文献数与库内相关文献总数之比。

4.查准率(检准率、相关率):检出的相关文献数与检出的文献总数之比。

§2.2 检索概念的分析和检索语言的应用

一、概念的切分、提取和扩展方法

1.主要检索词、辅助检索词和禁用词

1)主要检索词:与课题所研究的对象、方法有关的特质性事物名词。

2)辅助检索词:泛指性名词,只在检索结果过多需要限制时使用。

3)禁用词:介词、连词等虚词,一般不作为检索词使用。如:关于。

4)隐含概念也应予以舍弃。

2.概念的扩展方法

1)基于同一概念的检索词的扩展法

a.学名和俗名

b.简称、全称、音译和意译等。

c.反义词

d.名次的单复数、不同词性、英美语的不同形式等。(英语)

2)基于内容分析的概念扩展法

a.上位概念扩展法:分析检索对象的学科归属。

b.下位概念扩展法:概念分析的树形展开法。

c.隐含概念扩展法

3)基于检索结果的概念扩展法

二、检索语言

1.是用来描述文献的内容特征、外表特征和表达情报提问的一种人工语言。

2.主要有分类语言和主题语言两大类。

3.分类检索语言

1)根据科学学科之间的逻辑归属关系制成的类表。

2)《中图法》按照“五分法”区分知识。各个类目由拼音字母和数字构成的分类代码(或者称为类号)和相应的类名构成。

3)分类表中被区分的类成为上位类,区分出来的类就是下位类。上下位之间的关系反映了概念外延的包含与从属关系。处于同一上位类下的同一层次的下位类成为同位类。

4)研究一种理论、方法等在某/多方面应用或对某/多方面影响的课题,应在所应用或受影响的类目/本身所属的类目中查找。如人口预测/人文科学。

4.主题检索语言

1)关键词:自然语言。直接以作者在文献中的用词作检索词,没有预先编制的词表,能较快地反映科技的最新发展。容易造成漏查,用单个关键词检出的文献常常不太切题。

2)叙词(主题词):从自然语言中优选出来并经过规范化处理的名词术语,以规范的词或词组的形式固定下来,构成叙词表。特点:规范化的主题词和自由组配,并编有叙词分类索引和等级索引。

§2.3 检索算符与检索策略

一、布尔逻辑算符

1.逻辑或(OR)

1)用来组配具有并列关系、概念相同或相近的词,如同义词、相关词等。

2)基本作用:扩大检索范围,增加命中文献量,提高检索结果的查全率。

1.逻辑与(AND)

1)用来组配具有并列关系、概念相同或相近的词,如同义词、相关词等。

2)基本作用:扩大检索范围,增加命中文献量,提高检索结果的查全率。

2.逻辑或(OR)

1)有时也可用“*”代替。用来组配具有相互交叉限定关系的检索。

2)基本作用:缩小检索范围,减少命中文献量,提高检索结果的查准率。

3.逻辑非(NOT)

1)有时也可用“-”代替(不建议)。排除含有该算符后的词的记录。

2)基本作用:缩小检索范围,提高检索结果的查准率。

二、优先算符

1.以上的逻辑符号如果混合使用,其运算顺序通常为NOT,AND(类乘号),OR(类加号)。当需要改变这种运算顺序时,必须使用优先算符“( )”。

2.放在优先算符中的策略通常应该是逻辑或(OR)运算。单个汉语词组或者英语单词,以及只有多个逻辑与(AND)而没有逻辑或(OR)的检索策略中一般不得使用优先算符“( )”。

三、截词算符

1.所谓介词是指在检索词的某个局部截断,利用某些检索词的词干或不完整词形加上截词符进行检索,其目的是查找某一词干的不同变化形式,防止漏检、提高查全率。在EBSCO中,后截断截词符为“*”。DIALOG中,单个“?”表示无限截词,多个“?”表示有限截词。

2.后截断截词符:又称右截断、前方一致。截词符要紧接在词干后面,截词符和词干之间不能有空格。截词后词干一般应在三个字母以上。使用合理。

3.前截断:或称左截断、后方一致。

4.中截断:或称前后一致。

四、位置算符

1.提高查准率。

2.EBSCO中,位置算符有“Wn”和“Nn”算符两种。

3.(Wn)。表示在此算符两侧的检索词之间最多允许插入n个词。两个检索词的顺序不允许颠倒。

4.(Nn)。表示在此算符两侧的检索词之间最多允许插入n个词。两个检索词的次序任意。

五、字段限制

1.指定字段,减少输出篇数,提高查准率。

2.命令格式一般以“段码检索词”或“段码 检索词”为多见。

六、词组算符

1.词组检索:两个或两个以上单词、带有专有术语或名词性质、词序位置固定。

2.词组算符为双引号(“ ”)。

七、检索策略的调整方法

1.提高输出篇数。输出篇数过少的原因:检索词拼写错误;检索词过于冷僻具体,遗漏重要的同义词或隐含概念;位置算符、字段算符和逻辑与使用得过多;没有使用截词算符。

2.提高输出文献相关性。输出不相关文献篇数过多的原因:选用了多义性的检索词;截词截得过短;改用逻辑与的使用了逻辑或。

第三章 书目信息与iPAC

一、书目信息的概念

1.描述文献著者、题目和文献来源的信息称为文献的书目信息。

2.书目信息有简单、析出和详细三种类型之分。

3.简单的书目信息

1)常见于文后参考文献。反映出版物信息。

2)内容一般包含著者、题名和简单的出版事项内容。

3)描述的文献包括整本的图书、期刊等,不包括从整本文献中取出的单篇文献。

4)格式:图书:编者. 书名. 出版地:出版社. 出版年.

4.析出书目信息

1)常见于文后参考文献。反映某一篇论文、章节信息。

2)是指从整本文献中取出的、具有独立篇名的文献的书目信息。

3)一般有析出文献和母体文献两个层次的题名。如果是论文集还有析出文献和母体文献两个层次的作者。

4)文献中的章节或者段落如果没有单独的作者是不能写成析出文献的。

5)母体文献的作者和题名是查找书目信息系统时的主要取词依据,而析出文献的作者和题名是不能作为检索词的。

6)格式:图书:章节作者.章节名. 编者. 书名. 出版地:出版社. 出版年.

期刊:作者. 文章篇名. 期刊名,年,卷(期):起止页码

7)一般格式:析出文献作者.析出文献题名. 整本出版物作者.整本出版物名称.出版事项等(出版地:出版社,出版年等)