试题详情
- 简答题假设描述学生的信息包含属性:性别,籍贯,年龄。有两条记录p、q及两个簇C1、C2的信息如下,分别求出记录和簇彼此之间的距离。(k-means算法的拓展) p={男,广州,18},q={女,深圳,20} C1={男:25,女:5;广州:20,深圳:6,韶关:4;19} C2={男:3,女:12;汕头:12,深圳:1,湛江:2;24}
- 取x=1,得到的各距离如下:
d(p,q)=1+1+20-18=4
d(p,C1)=(1-25/30)+(1-20/30)+(19-18)=1.5
d(p,C2)=(1-3/15)+(1-0/15)+(24-18)=7.8
d(q,C1)=(1-5/30)+(1-6/30)+(20-19)=79/30
d(q,C2)=(1-12/15)+(1-1/15)+(24-20)=77/15
d(C1,C2)=[1-(25*3+5*12)/(30*15)]+[1-(6*1)/(30*15)]+(24-19)=1003/150 关注下方微信公众号,在线模考后查看
热门试题
- 以下哪些是数据仓库的主要应用?()
- 给定基本方体,方体的物化有三种选择:()
- 数据清理的目的是什么?
- 定量属性可以是整数值或者是连续值。
- 离群点可以是合法的数据对象或者值。
- 假定用于分析的数据包含属性age,数据元
- 下面哪种不属于数据预处理的方法?()
- 下列几种数据挖掘功能中,()被广泛的应用
- 离散属性总是具有有限个值。
- 下表所示的相依表汇总了超级市场的事务数据
- Apriori算法所面临的主要的挑战包括
- 帮助市场分析人员从客户的基本信息库中发现
- 数据的预处理方法有哪些?
- 对称的和不对称的二元属性有什么区别?
- 试述对于多个异种信息源的集成,为什么许多
- 数据仓库常见的存储优化方法是什么?
- 支持向量机中常用的核函数有多项式核函数、
- 分别说明利用支持度、置信度和提升度评价关
- 在图集合中发现一组公共子结构,这样的任务
- ROLAP是基于()的OLAP实现,而M