试题详情
- 简答题何谓文本挖掘?它与信息检索有什么关系(异同)。
- 文本挖掘是从大量文本数据中提取以前未知的、有用的、可理解的、可操作的知识的过程。它与信息检索之间有以下几方面的区别:
方法论不同:信息检索是目标驱动的,用户需要明确提出查询要求;而文本挖掘结果独立于用户的信息需求,是用户无法预知的。
着眼点不同:信息检索着重于文档中字、词和链接;而文本挖掘在于理解文本的内容和结构。
目的不同:信息检索的目的在于帮助用户发现资源,即从大量的文本中找到满足其查询请求的文本子集;而文本挖掘是为了揭示文本中隐含的知识。
评价方法不同:信息检索用查准率和查全率来评价其性能。而文本挖掘采用收益、置信度、简洁性等来衡量所发现知识的有效性、可用性和可理解性。
使用场合不同:文本挖掘是比信息检索更高层次的技术,可用于信息检索技术不能解决的许多场合。一方面,这两种技术各有所长,有各自适用的场合;另一方面,可以利用文本挖掘的研究成果来提高信息检索的精度和效率,改善检索结果的组织,使信息检索系统发展到一个新的水平。 关注下方微信公众号,在线模考后查看
热门试题
- 下列哪种可视化方法可用于发现多维数据中属
- 数据挖掘的预测建模任务主要包括哪几大类问
- 简述数据分类的两步过程。
- 考虑下表数据集,请完成以下问题: (1
- 分类器设计阶段包含三个过程:划分数据集、
- 一个数据仓库系统的建立通畅需要经过哪些步
- 层次聚类方法包括哪些?
- 分类模型的学习方法有哪些?
- 数据清理的目的是什么?
- 聚类分析包括连续型、二值离散型、()和混
- 如果叶贝斯网络的各个结点都没有任何证据,
- 帮助市场分析人员从客户的基本信息库中发现
- 何谓OLTP和OLAP?它们的主要异同有
- 请简述几种典型的多维数据的OLAP操作
- 相异度矩阵
- 简述数据预处理方法和内容。
- 如下哪些不是基于规则分类器的特点,()。
- 数据变换的内容是什么?
- 根据关联分析中所涉及的抽象层,可以将关联
- 许多基于内存的聚类算法所常用的两种数据结