本文主要是介绍机器学习实战学习笔记 --- Apriori算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式:
-
频繁项集 (frequent item sets):经常出现在一块的物品集合。
-
关联规则(associational rules):暗示两种物品之间可能存在很强的关系。
相关术语:
-
关联分析(关联规则学习):从大规模数据集中寻找物品之间的隐含关系被称作关联分析(associati analysis)或者关联规则学习(associaltion rule learning).
例子:
-
频繁项集:(葡萄酒,尿布,豆奶)就是一个频繁项集的例子
-
关联规则:尿布 -> 葡萄酒 就是一个关联规则。这意味着顾客买了尿布,那么他很可能就会买葡萄酒。
-
支持度:数据集中包含该项集的记录所占的比例。例如上面的图中,(豆奶)的支持度为4/5。(豆奶,尿布)的支持度为3/5。
-
可信度:针对一条诸如(尿布) -> (葡萄酒)在这样的具体关联规则来定义的。这条规则的可信度
这篇关于机器学习实战学习笔记 --- Apriori算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!