试题详情
- 简答题一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。
(a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。 (b)比较穷举法和Apriori算法生成的候选项集的数量。 (c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。
- (a)频繁1-项集:M,O,K,E,Y
频繁2-项集:{M,K},{O,K},{O,E},{K,Y},{K,E}
频繁3-项集:{O,K,E}
(b)穷举法:M=2k-1=211-1=2047
Apriori算法:23
(c){O,K}—>{E},支持度0.6,置信度1
{O,E}—>{k},支持度0.6,置信度1 关注下方微信公众号,在线模考后查看
热门试题
- 一个好的聚类分析方法会产生高质量的聚类,
- 简述Apriori算法的思想,谈谈该算法
- 元数据是描述数据仓库内数据的结构和建立方
- Apriori算法的计算复杂度受()影响
- 在多维关联规则挖掘中,我们搜索的不是频繁
- 进行数值归约时,三种常用的有参方法是:(
- 对于SVM分类算法,待分样本集中的大部分
- 在判定树归纳中,为什么树剪枝是有用的?
- 关于OLAP的特性,下面正确的是() (
- 维度可以根据其变化快慢分为元变化维度、(
- 简述数据挖掘的过程。
- 数据仓库在技术上的工作过程是()。
- 进行数据预处理时所使用的主要方法包括:(
- 下面哪种不属于数据预处理的方法?()
- Web挖掘包括哪些步骤?
- 以下是哪一个聚类算法的算法流程()。
- BIRCH是一种()。
- 求和函数sum()是一个()的函数。
- 聚类分析包括连续型、二值离散型、()和混
- 进行数据规范化的目的是()。