本文主要是介绍MAP和NDCG 概念及python代码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
MAP
- AP:平均准确率,类似于顺序敏感的recall;返回的推荐结果中,我们需要的排在越前面越好。
- MAP:为所有用户的AP取均值。
def MAP(origin, res, N):sum_prec = 0for user in res:hits = 0precision = 0# 一个用户一个用户算for n, item in enumerate(res[user]): precision;if item[0] in origin[user]:hits += 1# 越前面越好哦precision += hits / (n + 1.0)sum_prec += precision / (min(len(origin[user]), N) + 0.0)return sum_prec / (len(res))
NDCG
NDCG:
CG:将每个推荐结果相关性(relevance)的分值累加后作为整个推荐列表(list)的得分。但是没有考虑每个推荐结果处于不同位置对整个推荐效果的影响。
DCG:在CG的基础上引入位置影响因素,即Discounted Cummulative Gain, 对于排名靠后推荐结果的推荐效果进行“打折处理。但不同的推荐列表之间,很难进行横向的评估。
NDCG:我们评估一个推荐系统,是对整个测试集中的用户及其推荐列表结果进行评估。 那么不同用户的推荐列表的评估分数就需要进行归一化,也即NDCG(Normalized Discounted Cummulative Gain)。等于DCG/IDCG
def NDCG(origin,res,N):sum_NDCG = 0for user in res:DCG = 0IDCG = 0#1 = related, 0 = unrelatedfor n, item in enumerate(res[user]):if item[0] in origin[user]:DCG+= 1.0/math.log(n+2)for n, item in enumerate(list(origin[user].keys())[:N]):IDCG+=1.0/math.log(n+2)sum_NDCG += DCG / IDCGreturn sum_NDCG / (len(res))
这篇关于MAP和NDCG 概念及python代码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!