试题详情
- 简答题分别说明利用支持度、置信度和提升度评价关联规则的优缺点。
- 支持度
优点:支持度高说明这条规则可能适用于数据集中的大部分事务。
缺点:若支持度阈值过高,则许多潜在的有意义的模式由于包含支持度小的项而被删去;若支持度阈值过低,则计算代价很高而且产生大量的关联模式。
置信度
优点:置信度高说明如果满足了关联规则的前件,同时满足后件的可能性也非常大。
缺点:找到负相关的关联规则。
提升度:
优点:提升度可以评估项集A的出现是否能够促进项集B的出现。
缺点:会产生出现伪相互独立的规则。 关注下方微信公众号,在线模考后查看
热门试题
- 典型聚类方法有哪些?
- 下列哪些是数据变换可能涉及的内容?()
- 调和数据是存储在()数据仓库和操作型数据
- 分类器设计阶段包含三个过程:划分数据集、
- 维度可以根据其变化快慢分为元变化维度、(
- 什么是ETL?
- 什么是数据仓库的数据ETL过程?
- 简述数据清理的基本内容。
- 数据集分为三类:()。
- 简述抽样的定义及分类。
- 根据规则中所处理的值类型,关联规则可分为
- 从点作为个体簇开始,每一步合并两个最接近
- 比较数据挖掘与OLAP的差异?
- 数据挖掘对聚类的数据要求是什么?
- 下面哪个不属于数据的属性类型:()。
- 数据从集结区加载到数据仓库中的主要方法是
- 简述联机分析处理的四个特征?
- 什么是数据仓库的3层数据结构?
- 考虑值集{12,24,33,2,4,55
- 根据关联分析中所涉及的数据维,可以将关联