试题详情
- 简答题考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。
- (a)利用频繁3-项集生成的所有候选4-项集:
{1,2,3,4},{1,2,3,5},{1,2,4,5},{1,3,4,5},{2,3,4,5}
(b)经过剪枝后的所有候选4-项集:
{1,2,3,4},{1,2,3,5} 关注下方微信公众号,在线模考后查看
热门试题
- 下面哪些属于可视化高维数据技术?()
- 什么是特征选择?
- 数据挖掘定义是什么?
- 特征提取技术并不依赖于特定的领域。
- 决策树
- Bayes法是一种在已知后验概率与类条件
- 什么是关于数据仓库映射的元数据?
- 为什么要建立数据仓库?
- 一种常用的确定离群点的简单方法是()
- 对于SVM分类算法,待分样本集中的大部分
- 根据关联分析中所涉及的数据维,可以将关联
- 对于下图所示的正倾斜数据,中位数、平均值
- 为什么要进行维归约?
- 下面哪种不属于数据预处理的方法?()
- 简述数据挖掘的对象。
- 数据挖掘的效果直接受到()的影响。
- 比较统计学与数据挖掘的异同?
- 使用交互式的和可视化的技术,对数据进行探
- 可视化技术对于分析的数据类型通常不是专用
- 数据仓库常见的存储优化方法是什么?