2021年数据挖掘工程师考试题库_2021通关大杀器

数据挖掘工程师试题库

通过数据挖掘过程所推倒出的关系和摘要经常被称为：（）。
数据挖掘技术对聚类分析的要求有哪几个方面？
在基于规则分类器的中，依据规则质量的某种度量对规则排序，保证每一
如何提高Apriori算法的有效性？有哪些常见方法？
寻找模式和规则主要是对数据进行干扰，使其符合某种规则以及模式。
下面哪个不属于数据的属性类型：（）。
离散属性总是具有有限个值。
数据挖掘对聚类的数据要求是什么？
在多维关联规则挖掘中，我们搜索的不是频繁项集，而是（）
K均值是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动
分类方法的常用评估度量都有哪些？
粒度是对数据仓库中数据的综合程度高低的一个衡量。粒度越小，细节程
简述处理空缺值的方法。
（）通过将属性域划分为区间，从而减少给定连续值的个数。
考虑两队之间的足球比赛：队0和队1。假设65%的比赛队0胜出，剩
某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这
大型数据库中的关联规则挖掘包含两个过程（）和（）
下面哪种数据预处理技术可以用来平滑数据，消除数据噪声？（）
预测型知识
关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。
根据顾客的收入和职业情况，预测他们在计算机设备上的花费，所使用的
给定由两次运行K均值产生的两个不同的簇集，误差的平方和最大的那个
关于数据仓库的设计，四种不同的视图必须考虑，分别是：（）、（）、
雪花型模式是对（）维表的进一步层次化和规范化来消除冗余的数据。
进行数据规范化的目的是（）。
以下属于分类器评价或比较尺度的有（）。
下面关于Jarvis－Patrick（JP）聚类算法的说法不正确
什么是用户信息需求表（信息包图法）？它为什么适用于数据仓库的概念
分类模型的学习方法有哪些？
ROLAP是基于（）的OLAP实现，而MOLAP是基于多维数据结
更多试题请关注下方微信公众号

返回首页