试题详情
- 简答题定义下列数据挖掘功能: 关联、分类、聚类、演变分析、离群点检测 使用你熟悉的生活中的数据,给出每种数据挖掘功能的例子。
- 关联是指发现样本间或样本不同属性间的关联。例如,一个数据挖掘系统可能发现的关联规则为:
。其中,X是一个表示学生的变量。该规则指出主修计算机科学并且拥有一台个人计算机的学生所占比例为12%,同时,主修计算机专业的学生有98%拥有个人计算机。
分类是构造一系列能描述和区分数据类型或概念的模型(或功能),分类被用作预测目标数据的类的标签。例如,通过对过去银行客户流失与未流失客户数据的分析,得到一个预测模型,预测新客户是否可能会流失。
聚类是将数据划分为相似对象组的过程,使得同一组中对象相似度最大而不同组中对象相似度最小。例如,通过对某大型超市客户购物数据进行聚类,将客户聚类细分为低值客户、高值客户以及普通客户等。
数据演变分析描述和模型化随时间变化的对象的规律或趋势,尽管这可能包括时间相关数据的特征化、区分、关联和相关分析、分类、或预测,这种分析的明确特征包括时间序列数据分析、序列或周期模式匹配、和基于相似性的数据分析。
离群点检测就是发现与众不同的数据。可用于发现金融领域的欺诈检测。 关注下方微信公众号,在线模考后查看
热门试题
- 在基于规则分类器的中,依据规则质量的某种
- 下面哪种分类方法是属于神经网络学习算法?
- 为什么朴素贝叶斯分类称为“朴素”的?简述
- 分类知识的发现方法主要有哪些?分类过程通
- 下列几种数据挖掘功能中,()被广泛的用于
- MOLAP
- 数据立方体度量可以根据其所使用的聚集函数
- 某超市研究销售纪录数据后发现,买啤酒的人
- 偏差型知识
- 下列哪种可视化方法可用于发现多维数据中属
- 元数据是描述数据仓库内数据的结构和建立方
- 根据关联分析中所处理的值类型,可以将关联
- 抽取、转换、加载过程的目的是为决策支持应
- 考虑值集{1、2、3、4、5、90},其
- 简述ID3算法的基本思想及其主算法和建树
- 下面哪种不属于数据预处理的方法?()
- 简述数据挖掘的任务。
- 简述k-means算法,层次聚类算法的优
- 简述缺失值的处理方法。
- OLAP技术侧重于把数据库中的数据进行分