试题详情
简答题一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。 (a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。 (b)比较穷举法和Apriori算法生成的候选项集的数量。 (c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。
  • (a)频繁1-项集:M,O,K,E,Y
    频繁2-项集:{M,K},{O,K},{O,E},{K,Y},{K,E}
    频繁3-项集:{O,K,E}
    (b)穷举法:M=2k-1=211-1=2047
    Apriori算法:23
    (c){O,K}—>{E},支持度0.6,置信度1
    {O,E}—>{k},支持度0.6,置信度1
  • 关注下方微信公众号,在线模考后查看

热门试题