本文主要是介绍weka实战003:apriori关联规则算法的实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
weka实现的apriori算法是在weka.associations包的Apriror类。
在这个类,挖掘关联规则的入口函数是public void buildAssociations(Instances instances),而instances就是数据集,检查数据,设置参数,初始化变量,然后,用一个do-while循环计算关联规则。如果你看过上一篇,就知道其实就是从一项频繁集开始,逐级二项频繁集... N项频繁集,直到达到停止准则,终止循环。
在这个循环里,根据条件有若干种计算关联规则的方式,其中一种方式,是执行两个函数:findLargeItemSets()和findRulesBruteForce()。
findLargeItemSets()函数的作用,就是计算出所有的超过最小支持度的频繁集。所有的操作都是用集合来的,这里最重要的类就是AprioriItemSet,它做各种集合操作,也计算关联规则。
findRulesBruteForce()函数,就是暴力直接粗鲁地一个个取出前面算好的AprioriItemSet,计算关联规则。
整个过程就这么简单。
这篇关于weka实战003:apriori关联规则算法的实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!