[yzhpdh多读paper]On social computing research collaboration patterns: a socialnetwork perspective

本文主要是介绍[yzhpdh多读paper]On social computing research collaboration patterns: a socialnetwork perspective，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Abstract

本文旨在确定社会计算研究领域的关键研究人员和机构，并研究该领域的合作模式。我们设计不同层次的合著网络分析，有1998年至2011年社会计算领域6543份出版物的书目信息。本文简要介绍了当前社会计算领域的研究现状，可以为社会计算领域的新研究人员提供初步指导。

Keywords

社会计算、书目分析、计算社会科学、社会网络分析

Introduction

(我抽取了比较重要的内容）

在各种统计分析方法中，文献计量分析是量化研究领域当前趋势和合作模式的有效方法。它涉及对科学出版物的统计分析，使用诸如历史测绘文献共引、作者共引、共词分析、期刊映射，社会影响分析。

在这项研究中，我们使用这些分析和统计方法来检验社会计算领域中的协作模式。从四个方面确定了关键研究人员和机构：生产力、影响力、协作和传播。生产力通过出版记录来衡量，影响力通过引用计数来衡量，协作通过程度来衡量，传播通过介数中心性来衡量，介数中心性代表了节点在网络中的中心性。更高的生产力表明通讯作者是社会计算领域的活跃研究者。引文计数意味着研究者的影响力。学位（合著者/合作者的数量）和中间性中心性衡量研究者的合作模式。关键合作者和核心知识传播者具有高度的度和中间性中心价值

Data Set

从以下两个来源获取社会计算的关键词

1）维基百科上对“社交计算”的描述，
2）Flickr上的“社交计算”标签云。

最后由专家和有经验的研究者选出13个关键词，然后，我们从ISI科学网（WoS）检索这些术语及其替代词。这些关键词引用的论文信息也可以被下载。

Publishing trends

图1显示了不同国家贡献的出版物数量和收到的引文数量的统计结果。我们发现，排名前十位的国家在出版生产力和资本充足率方面分别占84.4%和90.8%。美国是主要的投稿者，它发表了35%的论文.并获得了我们数据集中近一半的引用。毫不奇怪，几乎所有的前十生产国也在前十名的引用计数中。

从2000年到2009年，我们可以看到一个明显的增长趋势。论文和作者的数量在2010年略有减少。2007年，作者和论文的数量显著增加（几乎是2006年的两倍）。王等人在IEEE Intelligent Systems上发表的一篇被高度引用的调查论文，以及一系列与社会计算相关主题的成功专刊的出现，可以解释这种爆发。我们还观察到，参与社会计算研究的机构数量从2000年的23家增加到2010年的1026家，不同机构之间的合作逐年增加。

Key Research

3.1 Productivity and influence

表2显示了主要作者的生产力和影响力排名。我们发现，Loreto, Vittorio（这位还在ted上做过演讲：【TED演讲】想要灵光乍现？从身边所熟悉的开始_哔哩哔哩_bilibili）是最具生产力和影响力的作家，有20项记录和457次引用。他的研究侧重于社会动力学和语言动力学，平均每年约有120篇论文引用他的论文。.Goh Hoe-Lian, Dion and Wang, Fei-Yue也是富有成效的研究者，分别位列第二和第三，他们有超过15篇论文。关注社会认知的Adolphs, Ralph是最有影响力的作家，被引用642次。其他研究人员则关注不同的问题，如民谣、个性化推荐、混合现实、众包、协作标记、社会认知和社会动力学.

3.2 Collaboration patterns

为了更好地了解社会计算领域的核心研究群体并构建合著网络，我们分析了前5000名被引用作者。我们用这些来代表整个情况，因为分布大致遵循幂律（其它类似文章也会提到)。无向网络包括5000个节点、7403条边和335个连接组件，其中节点代表作者，边代表2000年至2011年间某个时间点合作的两位作者。共有1638个孤立节点。网络中最大的部分被称为giant component。这个giant component包含1065个节点，除了孤立的节点外，这些节点约占30%。该网络的平均degree（合著者的平均数量）为3.5，比其他合著网络要小。如果我们进一步将孤立节点排除在网络工作之外，平均度数将增加到5.2。

表3显示了我们数据集中关于协作和传播的giant component的主要作者。这项研究主要集中在大众分类法、社交网络、个性化推荐和语义网方面。与我们的直觉相反，关键的知识传播者并不总是需要与许多研究人员合作。知识传递者Kompatsiaris，Yiannis，中心性最高（134582），但只有15位合作作者（见图3）。Bibby, Peter A与34位作者合作，但中间性不高。

还有一些重要的点

结点数量与中介中心度（betweenness centrality）成比例，且small-world (六度空间理论,就是那个大名鼎鼎的：多通过6个中间人你就能够认识任何一个陌生人)现象十分明显。

中介中心度是啥？

答：中介中心性主要是由美国社会学家林顿·弗里曼（Freeman，1979）教授提出来的一个概念，它是指网络中经过某点并连接这两点的最短路径占这两点之间的最短路径线总数之比。衡量了一个人作为媒介者的能力，也就是占据在其他两人快捷方式上的重要位置的人，他拒绝媒介，这两人就无法沟通，占据这样的位置愈多，就愈代表他具有很高的中介性，愈多的人联络时就必须要透过他。能够中介两群人之间的互动与信息，其中介性就很高，在社会网络分析中衡量一个人作为桥的程度的指针就是中介性。

图3标记了通过中介中心性或程度确定的前十位作者，黄色突出显示的标签是通过中间性中心性测量的前十位作者。其他节点是按程度衡量的前十位作者。Nelson、Eric E.和Traverso，P.都在这两组。最大的节点是Kompatsiaris，Yiannis（中间的红色节点），中介中心性为134582。他是这家公司的主要知识传播者。彼得·毕比是最活跃的合作者，他与30多人合作。这表明，积极的合作者并不总是知识的传播者。

Analysis of key institutions

哈佛大学是生产力最高的机构（54项记录），包括哈佛医学院、心理学系等许多子机构。他们关注社会计算的不同方面，比如情绪智力和计算社会科学。中国科学院以50篇论文排名第二，自动化研究所是该研究所中产量最多的部分，几乎关注社会计算的每个方面，包括社会标签、在线社区、文化建模、个性化推荐、社交媒体分析、人肉搜索、社会模拟和智能企业。
王飞跃 and Zeng, Daniel 是两个中心作家
国家心理健康研究所（NIMH）是最有影响力的机构（引用1029次），它更关注社会大脑、神经科学[49]和情绪调节。
排名前20位的研究主题几乎涵盖了社会计算的所有领域。

Collaborations among institutions

机构层面的协作网络非常稀疏（网络密度仅为0.0023）。在230个组件中有1939个不同节点，870条边，平均度数为1.6。在我们的分析中，857个孤立节点被排除在我们的分析之外。这个巨大的组成部分包含502个机构，占整个网络的四分之一以上。五分之三的节点只有一个合作者，三个机构有十多个合作者。

图4显示了机构协作网络的巨大组成部分。平均度数为2.1，巨型构件的最大度数为11。节点大小与其程度成正比。节点颜色表示不同的协作集群。图中标注了以中介中心度（前10名）或学位（前20名）衡量的关键院校。以黄色突出显示了中介中心度前20名的院校。未突出显示的节点是度数较高的机构。哈佛大学、麻省理工学院、代尔夫特理工大学和乌得勒支大学（高亮的绿色）都属于这两个群体。表5列出了对顶尖院校采取不同衡量指标。哈佛大学和麻省理工学院是主要的知识传播中心，也是与十多家机构合作的积极合作者。

我们采用Girvan-Newman算法来识别巨型组件中的协作组。图4显示了使用不同节点颜色的聚类结果。

Girvan-Newman算法：是一个社区检测算法（以下来源于知乎

社区的定义：就图而言，社区可以定义为节点的子集，这些节点彼此紧密相连，而与同一图中其他社区的节点松散相连。

社区检测的定义：在网络分析中，检测网络中的社区是最重要的任务之一。在一个大规模的网络中，比如在线社交网络，我们可能有数百万个节点和边缘。在这样的网络中探测社区是一项艰巨的任务。

最大的集群（用粉红色 [我怎么感觉是紫色...]填充）有123个机构和3个中心；北卡罗来那大学、蒙特勒大学、加利福尼亚大学、洛杉矶大学。集群II（蓝色节点）拥有110个机构。麻省理工学院和斯坦福大学也是中心节点。96个节点属于集群III（用红色填充）。中国科学院、罗马萨皮恩扎大学和印第安纳大学是这个集群中最关键的合作者。第四组（绿色部分）有83个机构。哈佛大学、牛津大学和剑桥大学是最活跃的合作者。马里兰大学和新加坡国立大学领导集群V（黑节点），其中包括

55个机构。最小的集群（集群六，灰色）由卡塞尔大学领导，有35个机构。代尔夫特理工大学和圣地亚哥大学将I和II集群在一起。麻省理工学院是一个活跃的知识传播机构，它连接着三个集群（集群II、集群III和集群IV）。集群V和集群VI分别由马萨诸塞州总医院和蒂尔堡大学连接。

不同的机构自然关注不同的方面。然而，单个机构并不总是保持相同的焦点。事实上，一个机构通常由多个子机构组成。不同的子机构可能会从不同的角度关注同一问题。例如，罗马大学（Univers.Roma La Sapienza）的子机构包括（Dipartmento Fis）、（Dipartmento Matemat）和（Dipartmento Matemat）和物理系，它们主要从不同角度研究社会动态。然而，同一机构也可能关注不同的问题。以剑桥大学为例，精神病学系从心理理论的角度关注社会认知，而实验心理学系则从生理学角度进行研究，而地理系则侧重于社会模拟来进行气候预测。这三个方面是相互关联的
不是同样的问题。

如图4和表5所示，机构之间的合作很常见，但存在偏见。大多数机构只有一个合作者。社会计算是多学科的，因此研究人员可以广泛合作。这可能是网络高度互联的一个原因。进入该领域的门槛相对较低这可能是吸引越来越多的搜索者加入这个社区的另一个原因。

Conclusion

我们通过分析1998年至2011年的书目数据，确定了社会计算领域的主要作者、机构及其合作模式。我们发现，合作在研究人员和机构层面都很受欢迎。在研究人员或机构层面，尽管生产率通常与影响力成正比，积极的合作者往往是知识的传递者，但也存在例外.

但是也存在以下问题：

数据集是通过关键字检索的，如果标题或摘要中没有匹配的关键字但与这个方向相关，也应该添加进去
数据集由十多个关键字检索的结果组成，但每个关键字的结果是异构的。有些关键字的记录可能超过300条，但有些关键字的记录少于30条。因此，一些记录可能会掩盖其他记录。标准化方法可能是一种可能的选择，以使结果更同质。

这篇关于[yzhpdh多读paper]On social computing research collaboration patterns: a socialnetwork perspective的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！