试题详情
- 简答题简述汉语自动标引方法的基本原理。
-
汉语自动标引技术一般包括词典标引法、切分标记法、语法分析法、汉语文献标引专家系统、单汉字标引法。其中词典标引法是一个传统的表引法,在目前国内自动标引中应用得相当普遍。切分标记法是将能够断开句子或表示汉字之间关系的汉字集合组成切分标记机内字典。
当原文句子被切分标记字典中的汉字构词属性分割成汉语词组或短语之后,再按一定的分解模式分割成单词或专用词组。语法分析标引法是通过对自然语言文法或句型文法的分析来抽取主题词加以标引。汉语文献自动标引专家系统的基本原理是,以现有的汉语专业主题词表为基础,构建概念语义网络,根据一定的抽词规则、标引规则和专门知识,对所处理的素材进行分析、判断,选择和确定标引主题词。 关注下方微信公众号,在线模考后查看
热门试题
- 简述对“信息是客观事物存在状态和运动方式
- 目录结构影响的是管理者对网站的日常维护。
- 印刷媒体阶段信息存储的方法主要有()
- 论述信息分布的规律。(从信息生产者、离散
- 信息资源管理的局限性()
- 论述信息资源管理的思想。
- 计算机硬件主要由运算器、()、存贮器、输
- 在项目质量监控过程中,在完成每个模块编码
- 以下不属于信息特征的是()
- “人类实践经验的总结,人类发现、发明和创
- 以下()属于信息研究成果。
- 述评与进展报告是哪一种信息组织形式()
- 一个合格的CIO必须是()两方面兼优的复
- 计算机加工
- 作为信息用户的人类个体或群体具有的特征有
- 信息分析对其所研究的对象来说具有()、评
- 数据挖掘技术出现在信息系统发展的()阶段
- 主题树方式是一种可供检索的等级式主题目录
- 如何全面理解信息系统?
- 主体是有思考能力和目的性的,因此,同样的