您现在的位置是:首页 >动态 > 2024-03-07 20:35:45 来源:

主题词检索(主题词)

导读 大家好,我是小夏,我来为大家解答以上问题。主题词检索,主题词很多人还不知道,现在让我们一起来看看吧!一、什么叫主题词、主题词表和检...

大家好,我是小夏,我来为大家解答以上问题。主题词检索,主题词很多人还不知道,现在让我们一起来看看吧!

一、什么叫主题词、主题词表和检索语言

(一)主题词。主题词也称叙词,是一些以概念为基础的,规范化的,具有组配性能,并可显示词间语义关系的词和词组。

主题词分正式主题词和非正式主题词。

正式主题词用来标引和检索文献,非正式主题词是查找正式主题词的引导词。

(二)主题词表。主题词表也称叙词表,是指由自然语言中优选出来的语义相关、族性相关的名词术语按字顺排列所组成的一种规范化的动态词典。

(三)《公文主题词表》。《公文主题词表》是用于公文主题标引与检索的主题词表。它是适应机关办公自动化,尤其是计算机数据处理的需要,为党政机关公文主题标引与检索而编制的一部术语控制工具。

(四)检索语言。检索语言是根据人们检索工作的需要而创造的一种人工语言,它是存储、查找文献的共同依据,也叫标引语言。

检索语言又分为分类语言和主题语言。

分类语言的概念。是指以阿拉伯数字或以拉丁字母和数字混合作为类目标识符号,以基本类目作为词汇,以类目的从属关系表达复杂概念的一类检索语言。

主题语言的概念。是以直接论述的事物、对象为依据,以自然语言为基本词汇,以概念之间的逻辑关系作为构词法的一类检索语言。

二、为什么要标引公文主题词

(一)标引公文主题词有利于建立先进的公文检索体系,辅助领导同志决策。

信息量的增加,数据量的增大,单纯的分类检索方法难以满足人们对多主题文件查找的要求。

主题检索方法弥补了分类检索方法的不足,检索更自由,查找跨度更大。

(二)标引公文主题词是建立机关办公自动化检索系统的前提条件。

办公自动化系统通过文件上标注的主题词将文件纳入检索系统。

办文人员在办公自动化系统上通过主题词来查找有关主题的文件。

(三)标引主题词是实现公文管理现代化的基础。

档案工作人员可以根据公文主题词编制档案、文件主题索引或主题目录、专题目录等手工检索工具。

办文人员可直接利用根据公文主题词而建立的档案编目计算机检索系统查找文件。

(四)对提高秘书工作人员业务素质有重要作用。

三、《公文主题词表》的体系结构

《公文主题词表》由范畴表、字顺表、附表三大部分组成。

1、范畴表。范畴表又称分类表,它根据公文的主要内容和职能部门的分工划分若干范畴,将字顺表中所列款目词按词义归入有关类目,满足按类查词和按族性检索的要求。

范畴表设两级类目,一级类目19个,用一个汉语拼音字母标识。二级类目70个,用两个拼音字母标识。

2、字顺表。字顺表由正式主题词与非正式主题词款目(词单元)、款目词的汉语拼音、范畴号和词的参照关系四部分组成,个别词还有注释。

例如,第121页:

财政政策

款目词汉语拼音→cai zheng zheng ce

①汉语拼音。注上汉语拼音主要是便于按音排序和按音查词。

②款目词。款目词单元按汉语拼音字顺规定的同音同调同形排列,起排列和查找作用。

③范畴号。范畴号即每个款目词所属的分类范畴编号。这是字顺表与范畴表联系的渠道,通过范畴号可以在范畴表中查找与该主题词同属一个类别的相关主题词。

④参照关系。参照关系有等同关系、属分关系和相关关系三种。

等同关系指两个以上概念相同或相近的主题词之间的关系,也叫用代关系,用“Y”表示正式主题词,用“D”表示非正式主题词;

属分关系指概念上具有隶属关系的主题词之间的关系。不同隶属关系主题词分别用 “F”、 “S”、 “.”、“..”和“Z”表示。“F”是下位词指引符,该词之后的主题词为下位词,用“.”、“..”表示,黑点多少表示词的等级,黑点越多表示该词越专指;“S”是上位词指引符;“Z”是族首词指引符,同时带有“*”号。

相关关系指主题词之间具有的交叉、对立、矛盾、对应等相互参照的关系,用C表示。

3、附表。附表有三个,内容为:组织机构名称表;中国地区名称表;世界各国和地区名称表。附表中的主题词与字顺表中的主题词具有同等效力。

四、怎样标引公文主题词

(一)公文主题分析。

1、审读文件,了解主题。审读文件的重点。

2、分析主题类型,确定主题概念。

主题类型分为单主题和多主题两种。

单主题是指一份公文所研究和论述的只有一个对象或问题。多主题是指一份公文所研究和论述的主题对象不只一个,而是两个或者更多,而且都是并列的独立主题。

3、分析主题结构,确定主题因素。主题因素分为主体因素、通用因素、位置因素、时间因素和文献类型因素五部分。

主体因素是指公文论述的主题中的关键性概念,它是公文主题的主要成分,其他主题因素都附属于这个主体因素;通用因素是构成主题的一些通用概念,它说明主体因素的动态和趋势。通用概念没有专指性也没有独立检索价值,不宜单独使用;位置因素是表明主体因素所处的位置和范围,文件规定适用的地区、位置和对象。位置因素包括国家名称、地区名称和组织机构名称; 时间因素是从时间上对主体因素进行限定,把主题对象放在特定的时间范围之内。时间因素包括年代、时代、朝代、期限等;文献类型因素包括文献种类、公文文种、文件名称编号等。

(二)查表选词,转换主题概念。

通过查找主题词表进行主题概念转换时,必须采用词表上规范化的主题词。转换主题概念主要有两种形式:一是直接转换。二是间接转换。

(三)主题词组配标引。

组配,就是用两个或两个以上主题词构成逻辑关系组合以表达一个专指概念的一种方式。它以词间语法关系和逻辑关系为基础,只有相容关系的概念词才可以组配,而且,不是字面上的组配,决定的因素是逻辑关系。组配标引有概念交叉组配、概念限定组配、上位词或下位词组配。应优先考虑交叉组配和限定组配。

交叉组配是指两个组配的概念之间具有交叉关系,两个概念的外延有一部分重合。

限定组配是以概念的限定为基础,由属概念过渡到种概念的组配。

(四)直接上位词标引和靠词标引。

上位词标引要求两个概念之间具有属分关系。靠词标引要求两个概念必须是同一范畴、同一属性。无论是直接上位词标引或是靠词标引,都不能越级标引。

(五)自由词标引。

自由词标引是用未经规范化处理的自然语言表述公文主题概念,并作为表达公文主题概念的检索标识。

自由词标引范围:一是某些主题概念虽然可以采用组配标引或上位词标引,但使用频率较高;二是新出现的主题概念,包括新科技、新政策、新理论、新名词术语等;三是人物、时间和年代称号;四是地区、组织机构名称。

自由词标引应遵守的规则:一是应认真地查找词表,确实没有合适的专指的主题词,才进行自由词标引。二是可选用其他词表以及权威性参考书、工具书上的词。三是所选的词必须具有较强的检索功能和组配功能,具有实用性,能检索,能组配。四是应尽可能做到词形简单、概念明确。五是在标出自由词的同时相应标出它的上位主题词(或类别词)。六是在自由词后标上“△”符号,并适时将新词登记在主题词表上。选用《词表》以外的地名(组织机构名)、时间、人名、文献名称等专用名词作自由词标引时,不作"△"标记。

五、标引工作中一些具体问题

(一)主题词的排列。

反映公文整体(概述)内容的主题词在前,反映公文部分(分述)内容的主题词在后。

在单主题公文中,反映中心内容的主题词在前,反映其他方面的主题词在后;在多主题公文中,反映公文整体(概述)内容的主题词在前,反映公文其他内容的各主题词按出现的先后次序排列。

作为自由词标引的地名(组织机构名)、时间、人名等,应置于表现公文内容的主题词后面,置于表现公文形式的主题词前面。同时出现在同一公文中,则按地名(组织机构名)、时间、人名的顺序排列。

(二)文种的标引。

文种作为正式主题词,标在所有主题词的最末位。在转(印)发类型通知中,被转(印)发的公文的文种可不作为主题词标引。但如果被转(印)发的公文属法规性质,其名称为条例、规定、办法等,则应作为主题词标引。

(三)标点符号的标引。

公文主题词一般不应出现标点符号。

在《公文主题词表》中带有标点符号的正式主题词,应予保留。因为这些标点符号有特殊功能,删去后容易引发歧义。

自由词标引时一般不要带标点符号。

本文到此讲解完毕了,希望对大家有帮助。