试题详情
- 简答题在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法。
-
1,忽略元组。当类标号缺少是通常这么做,当每个属性缺省值的百分比变化很大时,他的效果非常差。
2,人工填写空缺值。这种方法工作量大,可行性低。
3,使用一个全局变量填充空缺值。
4,使用属性的平均值填充空缺值。
5,使用与给定元组属同一类的所有样本的平均值。
6,使用最可能的值填充空缺值。 关注下方微信公众号,在线模考后查看
热门试题
- 如何提高Apriori算法的有效性?有哪
- 给定由两次运行K均值产生的两个不同的簇集
- 划分聚类方法对数据集进行聚类时包含什么要
- 在数据仓库中,元数据的主要用途包括哪些?
- 以下属于可伸缩聚类算法的是()。
- 考虑下面的频繁3-项集的集合:{1,2,
- 抽取、转换、加载过程的目的是为决策支持应
- 数据聚合的目的是什么?
- 简述数据仓库设计的三级模型的基本内容。
- 什么是聚类分析?聚类分析的应用领域有哪些
- 数据挖掘的性能问题主要包括:()、()和
- 根据关联分析中所涉及的抽象层,可以将关联
- 频繁项集
- 什么是数据仓库的数据ETL过程?
- 评估分类模型的性能的方法有哪些?
- 置信度(confidence)是衡量兴趣
- 数据规范化
- 根据关联分析中所涉及的数据维,可以将关联
- 简述数据挖掘的对象。
- BIRCH是一种()。