试题详情
简答题假设描述学生的信息包含属性:性别,籍贯,年龄。有两条记录p、q及两个簇C1、C2的信息如下,分别求出记录和簇彼此之间的距离。(k-means算法的拓展) p={男,广州,18},q={女,深圳,20} C1={男:25,女:5;广州:20,深圳:6,韶关:4;19} C2={男:3,女:12;汕头:12,深圳:1,湛江:2;24}
  • 取x=1,得到的各距离如下:
    d(p,q)=1+1+20-18=4
    d(p,C1)=(1-25/30)+(1-20/30)+(19-18)=1.5
    d(p,C2)=(1-3/15)+(1-0/15)+(24-18)=7.8
    d(q,C1)=(1-5/30)+(1-6/30)+(20-19)=79/30
    d(q,C2)=(1-12/15)+(1-1/15)+(24-20)=77/15
    d(C1,C2)=[1-(25*3+5*12)/(30*15)]+[1-(6*1)/(30*15)]+(24-19)=1003/150
  • 关注下方微信公众号,在线模考后查看

热门试题