机器学习分类算法 朴素贝叶斯 条件概率公式 P ( A ∣ B ) = P ( A ∩ B ) P ( B ) P(A \mid B)=\frac{P(A \cap B)}{P(B)} P(A∣B)=P(B)P(A∩B) 在B条件发生的情况下,A发生的概率。 事件 A 发生的概率定义为事件 A 发生的情况数除以所有可能情况的总数。 P(A) =(事件 A 发生的情况数)/(所有可能情况
一.决策树 决策树中的基尼系数(Gini Index)是用于衡量数据集中不纯度(或混杂度)的指标。基尼系数的取值范围在0到0.5之间,其中0表示数据完全纯(同一类别),0.5表示数据完全混杂。 基尼系数的公式 对于一个节点,基尼系数的计算公式为: G i n i ( p ) = 1 − ∑ i = 1 n p i 2 Gini(p) = 1 - \sum_{i=1}^{n} p_i^2