试题详情
- 简答题数据聚合需要考虑的问题有哪些?
- (1)模式识别:这主要是实体识别问题;
(2)冗余:一个属性是冗余的,即它能由另一个表导出,如果属性或维的命名不一致,也可能导致冗余,可以用相关分析来检测;
(3)数据值冲突的检测与处理:有些属性因表示比例或编码不同,会导致属性不同。 关注下方微信公众号,在线模考后查看
热门试题
- 为什么要进行维归约?
- 当维表中的主键在事实表中没有与外键关联时
- 数据仓库后端工具和程序包括哪些?
- 分类问题中常用的评价准则有精确度、查全率
- 数据聚合的目的是什么?
- 简述分类器设计阶段包含的3个过程。
- 下面哪种不属于数据预处理的方法?()
- 一种常用的确定离群点的简单方法是()
- 数据归约的目的是()。
- Bayes法是一种在已知后验概率与类条件
- 根据关联分析中所涉及的数据维,可以将关联
- 一个典型的数据挖掘系统应该包括哪些组成部
- 簇有效性的面向相似性的度量包括()。
- 某超市研究销售纪录数据后发现,买啤酒的人
- 遗传算法
- 在数据挖掘中,常用的聚类算法包括:()、
- 数据挖掘对聚类的数据要求是什么?
- 关联规则挖掘过程是发现满足最小支持度的所
- 求和函数sum()是一个()的函数。
- 如果规则集R中不存在两条规则被同一条记录