本标准采用下列定义
3.1 档案
国家机构、社会组织和个人在社会活动中直接形成的有价值的各种历史文献。[DA/T1中1.1]
3.2 档案主题
档案具体记述的对象或问题。
3.3 主题词
又称叙词(即正式主题词)。标引与检索档案时,主题词表中规定用于表达档案主题的词语。
3.4 非正式主题词
又称非叙词。是正式主题词的同义词或准同义词,主题词表中收录但规定不能作档案标识,只起指引作用的词语。
3.5 档案主题词表
由反映档案内容的主题词及其词间关系组成的规范化词典,是将档案、标引人员或用户的自然语言转换成规范化语言的一种术语控制工具。
3.6 主题标引
对档案给予主题词标识的过程。[DA/T1中5.6.2]
3.7 主题标引深度
指赋予一个标引对象主题词数量的多少。
4、主题分析
主题分析是主题标引的基础,通过对档案的内容特征进行分析,准确提炼和选定主题概念。
4.1 审读档案
通过审读档案,了解和判断档案所反映的中心内容和其它主题因素。
4.1.1 阅读题名
文件和案卷的题名是对档案内容的概括。在题名准确反映档案中心内容的情况下,阅读题名是分析、提炼主题的一条捷径,但题名不能作为提炼主题概念唯一的依据。
4.1.2 浏览全文
在档案无题名或题名不能全面、准确地反映档案主题时应浏览全文。浏览全文应注重了解题名未能反映的主题和深层次主题,发掘隐含主题。浏览全文重点是阅读全文的开头、结束语、段落题名,必要时阅读批语、摘要、简介、目次、图表、备考表等内容。
4.2 主题类型
主题的类型可以分为单主题和多主题两种。单主题包括单元主题和复合主题(即多元主题),多主题则由几个单主题组成。
4.3 主题结构
任何主题都是由一定的主题因素构成的。构成主题的因素一般可以分解为:主体因素、通用因素、位置因素、时间因素、文种因素。
4.4 主题概念的选定
在审读档案题名或全文的基础上,提炼选定出一个或若干个表达档案主题的自然语言主题概念。选定主题概念的原则是:
a)选定的主题概念应是档案中论述的问题;
b)选定的主题概念应具有实际检索意义;
c)选定的主题概念应能全面、准确地表达档案主题。
5、选词标引
造词标引是对档案主题分析出的概念给予主题词标识的过程。
5.1 在主题分析中选出的主题概念, 应转化成档案主题词表中的主题词(正式主题词)进行标引,书写形式应与词表中的词表中的词形相一致。非正式主题词不能作为标引词使用。
5.2 标引词应选用档案主题词表中与档案主题概念直接相对应的、专指的主题词。
5.3 当词表中没有与档案主题概念直接相对应的专指主题词时,应选用两个或两个以上的主题词进行组配标引。
5.3.1 组配应是概念组配。概念组配包括以下两种类型:
a)交叉组配,即同级词组配。 指用两个或两个以上具有概念交叉关系的同级主题词组配表达其相应的下位概念。
b)方面组配,即限定组配。指由一个表示事物的主题词, 与另外一个或几个表示事物某个属性或某个方面的主题词组配表达相应的下位概念。
5.3.2 组配标引时,优先考虑交叉组配,然后考虑方面组配。
5.3.3 应选用与档案主题概念关系最密切、 最临近的主题词进行组配,不能越级组配,即不能用其上位或下位主题词组配。
5.3.4 组配结果所表达的概念应清楚、确切, 只能表达一个主题概念。
5.3.5 为避免多主题虚假组配造成误检, 可以加联系符号区分每个问题。其做法是:在主题词后用数字1.2.3.……表示分组符号,数字相同的主题词是一组相关联的组配概念。数字中的“0”, 称作***同联号,表示该主题词可以和该档案中标引的任何一个主题词进行组配。