检索词检索词分类
发布网友
发布时间:2024-10-16 11:43
我来回答
共1个回答
热心网友
时间:2024-11-24 04:05
检索词根据词的性质和语言规范性,可以分为四类和两类。
一类是表示主题的检索词,包括标题词、单元词、叙词和关键词。标题词是经过规范化处理的词汇,单元词是从信息内容中提取的基本词汇,叙词是从信息内容中抽取,概括表达基本概念的规范化自然语言词汇,关键词是从信息单元中提取的,能表征信息主体内容的自然语言词汇,未经规范化处理。
二类是表示作者的检索词,如作者姓名、机构名。
三类是表示分类的检索词,如分类号。
四类是表示特殊意义的检索词,如ISBN、ISSN、引文标引词等。
另一方面,从语言规范性划分,检索词又可分为受控词和非受控词。受控词是预先规范化的检索语言,来源于主题词表、叙词表、分类表等,数据库采用受控标引时,应优先使用受控词。非受控词是非规范化的自然语言词汇,又称自由词。
受控词与非受控词各有优缺点,受控词检索效率高,能全面检索选定概念的内容,标引人员已解决自然语言中的同义、近义关系,检索相对容易。但受控词受限于其先组性质,不能及时反映新事物的发展,概念数量有限,结构复杂,难以满足信息用户多样化需求,也难以被非专业人员掌握。非受控词在一定程度上弥补了这些缺陷,允许任意选择词汇,专指性强,无需熟悉词表,能使用新术语及时检索新概念。然而,非受控词不能提供概念的等级结构,不能检索宽泛概念,难以解决同义词、近义词、相关词的结合问题。
综上所述,受控词和非受控词在检索过程中互为补充。数据库词表与查询主题概念不存在一一对应关系,许多概念无法反映。因此,当检索结果不满意时,应对选词进行分析,增加、删除或替换词汇,以获得更满意的结果。