CELF(Cost-Effective Lazy Forward selection)具有成本效益的惰性前向选择算法

本文主要是介绍CELF(Cost-Effective Lazy Forward selection)具有成本效益的惰性前向选择算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

CELF(Cost-Effective Lazy Forward selection)算法解析
  

  引言:在社交网络影响力最大化问题的求解过程中,我们往往需要去选择一些目标种子结点作为信息初始传播的源头。贪婪算法在传播效果上的解决可以达到影响的最大化,但是在时间复杂度上面显得确十分糟糕。为此CELF算法应势而生,CELF算法利用了函数次模性的特点,在第一轮选择种子结点时,计算网络中所有节点的边际收益,但将在之后的过程中,不再做网络节点边际收益的重复计算,这相对于传统的贪婪算法,将在时间上得到非常明显的改善。本文是对论文《Cost-effective Outbreak Detection in Networks》的补充,如果你是看了这篇论文之后,依然不明白CELF算法,那么本文可能会给予你一点点启示。

一.函数的次模性(submodular)

  对于函数次模性的理解,举个例子,当我们在饿了的时候,吃一碗饭得到的满足感,是比饱腹的时候得到的更多,函数次模性数学解释如下:
在这里插入图片描述

图1 函数的次模性

  图中的 R ( ) R() R()函数,我们可以看作是一个收益函数,因为在原文中的解释相对稍微复杂,我就用另一个例子来说明。图1中的A和B看作是选好的种子集, R ( ) R() R()可以看作是A,B种子集在网络中影响到的非种子结点的数量!次模性的意思就是,当种子集A比B小的时候,新的种子结点S加入到种子集A和B中, R ( A ∪ R(A\cup R(A{s} ) − R ( A ) )-R(A) )R(A)获得边际收益更大!

二.CELF 算法伪码解读

在这里插入图片描述

图2 CELF算法伪码

  CELF算法的说明:因为算法最主要的是“篮筐处”,我对“篮筐”里面的伪码,做出如下逐行解释:(如果你已经熟悉伪码可以不用看)

  第一行:输入网络结构 g ( V , E ) g(V,E) g(V,E),网络结构 V V V是点的集合, E E E是边的集合;R是收益函数;c是成本函数;B是预算;type就是网络节点成本的类型,原文中有两种类型,UC统一成本(常数),CB非统一成本(会变化的)。

  第二行:最开始种子结点集A为空集;对于每一个V中的结点s,初始化它的边际收益 δ s \delta_{s} δs为无穷大。

  第三行:循环条件为,当把种子结点S加入到种子集A中的时候,成本函数的值c小于等于预算B,然后可以继续循环。循环为后置循环,意思是先循环再判断是否满足循环条件。

  第四行:进入循环体内,对于每一个非种子结点s,我们给它打上flase标签。

  第五行:永久循环,除非第八行运行条件成立退出。

  第六、七行:根据种子结点的成本类型为UC或者CB并进行以边际收益 δ s \delta_{s} δs为选则依据的结点选择(选择边际收益最大的)。

  第八行: 如果找出来的最大边际收益 δ s \delta_{s} δs结点的标签为ture,则加入种子集A,并结束循环,进行下一轮选择。

  第九行:如果找出来的最大边际收益结点的标签为flase,则重新计算边际收益,并改标签为ture。

次模性在CELF中的体现解析
  在第二轮选择种子结点的时候,并没有全部计算所有结点的边际收益(可能计算了部分)

  因为:
在这里插入图片描述

图3 论文截图处“蓝色框部分”给出了解释

  因为第一轮边际收益计算后,排序在顶端的点依然在顶端,只有可能当他们的边际收益很接近的时候,可能在第K(k>1)轮需要多计算几次。另外,如果结点之间的边际收益相隔大,那么之后的计算完全没必要感觉,直接依靠第一轮的边际收益排序来选择就好了!

  这就是相比于贪婪算法时间节省的地方,第一轮时间复杂度是一样的,后面的选择轮数就不需要再去遍历估计那些没有被选为种子结点的结点的边际收益,此处正是次模性的体现(领会)
   该解析如果还是看得不明白,可以参考另一位作者写的,虽然简陋,希望能一起结合论文看,能让你明白!
https://blog.csdn.net/s1102379635/article/details/8524447

这篇关于CELF(Cost-Effective Lazy Forward selection)具有成本效益的惰性前向选择算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/344578

相关文章

el-select下拉选择缓存的实现

《el-select下拉选择缓存的实现》本文主要介绍了在使用el-select实现下拉选择缓存时遇到的问题及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录项目场景:问题描述解决方案:项目场景:从左侧列表中选取字段填入右侧下拉多选框,用户可以对右侧

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

如何选择适合孤独症兄妹的学校?

在探索适合孤独症儿童教育的道路上,每一位家长都面临着前所未有的挑战与抉择。当这份责任落在拥有孤独症兄妹的家庭肩上时,选择一所能够同时满足两个孩子特殊需求的学校,更显得尤为关键。本文将探讨如何为这样的家庭做出明智的选择,并介绍星贝育园自闭症儿童寄宿制学校作为一个值得考虑的选项。 理解孤独症儿童的独特性 孤独症,这一复杂的神经发育障碍,影响着儿童的社交互动、沟通能力以及行为模式。对于拥有孤独症兄

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验