试题详情
- 简答题在数据挖掘之前为什么要对原始数据进行预处理?
-
原始业务数据来自多个数据库或数据仓库,它们的结构和规则可能是不同的,这将导致原始数据非常的杂乱、不可用,即使在同一个数据库中,也可能存在重复的和不完整的数据信息,为了使这些数据能够符合数据挖掘的要求,提高效率和得到清晰的结果,必须进行数据的预处理。
为数据挖掘算法提供完整、干净、准确、有针对性的数据,减少算法的计算量,提高挖掘效率和准确程度。 关注下方微信公众号,在线模考后查看
热门试题
- 给定基本方体,方体的物化有三种选择:()
- ()通过将属性域划分为区间,从而减少给定
- 什么是数据清洗?
- Apriori算法的计算复杂度受()影响
- 简述基于划分的聚类方法。划分的准则是什么
- 对于SVM分类算法,待分样本集中的大部分
- 为什么要进行维归约?
- 简述数据仓库与数据挖掘的关系?
- 以下两种描述分别对应哪两种对分类算法的
- 怎样从历史数据中训练出结点之间的条件概率
- 孤立点
- 下面哪种数据挖掘方法可以用来检测孤立点?
- 简述数据仓库设计的三级模型的基本内容。
- 哪种数据变换的方法将数据沿概念分层向上汇
- 考虑值集{1、2、3、4、5、90},其
- 从点作为个体簇开始,每一步合并两个最接近
- 字段Hair_color={auburn
- 何谓OLTP和OLAP?它们的主要异同有
- 通过数据挖掘过程所推倒出的关系和摘要经常
- 给定由两次运行K均值产生的两个不同的簇集