试题详情
- 简答题以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表示前面数字出现次数) 1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。 请分别用等宽的方法和等高的方法对上面的数据集进行划分。
- (1)等宽方法:划分为3个数据集,每个数据集的宽度为价格10。价格在1—10之间出现次数为13;价格在11—20之间出现的次数为24;价格在21—30之间出现的次数为13。
(2)等高方法:划分为2个数据集,每个数据集的高度为出现的次数4。出现次数1—4之间的价格为1、8、10、12、14、21、28、30,共8个数据;出现次数5—8之间的价格为5、15、18、20、25,共5个数据。 关注下方微信公众号,在线模考后查看
热门试题
- 某超市研究销售纪录数据后发现,买啤酒的人
- 将原始数据进行集成、变换、维度规约、数值
- 什么是叶节点?
- 什么是频繁项集?
- 下列度量不具有反演性的是()。
- 使用星型模式可以从一定程度上()查询效率
- 从应用的角度看,数据仓库的发展演变可以归
- 为什么要关注离群点?
- 假定用于分析的数据包含属性age,数据元
- 考虑下表数据集,请完成以下问题: (1
- 项集的频率是指()
- 一个数据仓库系统的建立通畅需要经过哪些步
- 决策树是一种树形结构,包括()和()三个
- 在判定树归纳中,为什么树剪枝是有用的?
- 简述联机分析处理的四个特征?
- 数据挖掘
- 有关数据仓库的开发特点,不正确的描述是:
- 如果叶贝斯网络的各个结点都没有任何证据,
- 对于下图所示的正倾斜数据,中位数、平均值
- 数据仓库是随着时间变化的,下面的描述不正