Football数据集可视化处理——gephi可视化处理数据

2023-10-06 21:59

本文主要是介绍Football数据集可视化处理——gephi可视化处理数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

#1 football数据集的文件格式
根据如图所示football数据集和的文件格式如下所示:
下图表示football数据集节点部分信息
这里写图片描述
下图表示football数据集边的部分信息
这里写图片描述
根据上述两个图中的格式对football数据集的格式介绍可以介绍为如下所示:

Creator "Mark Newman on Sat Jul 22 05:32:16 2006"
graph
[node[id **value **label ****]...node[id **value **label ****]edge[id **value **label ****]...edge[id ***value **label ****]
]

#2 football数据集文件格式的转化
根据上述的football文件,我们将数据文件转化成两个文件,这两个文件分别用来存储football数据集的边信息和节点信息,对football数据集文件的处理如下。
##2.1 football数据集节点信息文件
根据gephi通过csv导入信息的需要,我们将数据信息处理成如下的数据集节点文件格式:

Id Label Value
1  Tom   3
2  Bob   4

在football数据集中将football.gml文件处理得到的结果如下所示:
这里写图片描述
其中:

Id:用于标识唯一的一个点
Label:标识节点的标签或者是名称
Value:标识节点的所属的社区。

##2.2 football数据集边信息文件
根据gephi通过csv导入数据的格式,我们分为有向图和无向图两种数据格式,对于有向图的导入数据格式如下所示:

Source Target Weight
1 3 2
2 4 1
根据上述公式:
Source:表示源节点
Target:表示目的结点
Weight:表示对应的边的权重

在无向图的导入中需要加入Type类型得出的数据格式如下所示:

Source Target Weigth Type
1 3 2 Undirected
2 4 1 Undirected

如下图所示为football数据集的数据个格式,football数据集是无权图因此没有有weight。
这里写图片描述

在football数据集的616条边中有三条边是重复出现的分别为

28 18
85 4
100 15

在通过gephi对这些边进行模块化社区划分运算的时候需要将这些边删除,否则无法运行。
##2.3 对football.gml处理代码

#include <iostream>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
using namespace std;int main()
{FILE* inputfile = NULL;FILE* nodefile = NULL;FILE* edgefile = NULL;inputfile = fopen("football.gml","r");nodefile = fopen("nodefile.txt","w");edgefile = fopen("edgefile.txt","w");fprintf(nodefile, "Id Label Value\n");fprintf(edgefile,"Source Target Type\n");char strLine[1024];int i = 0;int node = 0;int edge = 0;//char nodeinfo[100];char edgeinfo[100];while(!feof(inputfile)){fgets(strLine,1024, inputfile);if(strncmp(strLine+4,"id",2)==0 ){char id[5];char label[50];char value[5];memset(label,0,50);int idint = 0, valueint = 0;int copylen = 0;copylen = strlen(strLine) - 8;strncpy(id,strLine+7,copylen);idint = atoi(id)+1;fgets(strLine,1024, inputfile);copylen = strlen(strLine) - 13;strncpy(label,strLine+11,copylen);fgets(strLine,1024, inputfile);copylen = strlen(strLine) - 10;strncpy(value,strLine+10,copylen);valueint = atoi(value)+1;//cout << valueint << endl;fprintf(nodefile,"%d %s %d\n",idint,label,valueint);}if(strncmp(strLine+4,"source",6)==0){char target[5];char source[5];int sourceint = 0,targetint = 0;memset(target,0,5);memset(source,0,5);int copylen = 0;copylen = strlen(strLine)-12;strncpy(source,strLine+11,copylen);sourceint = atoi(source)+1;fgets(strLine,1024, inputfile);copylen = strlen(strLine)-12;strncpy(target,strLine+11,copylen);targetint = atoi(target)+1;fprintf(edgefile,"%d %d undirected\n",sourceint,targetint);}}fclose(nodefile);fclose(edgefile);return 0;
}

#3 gephi点表和边表的导入并生成football图像
(1)点击文件->Import spreadsheet如下图所示:
这里写图片描述

(2)选择需要导入的文件进行数据导入
这里写图片描述
注意选择导入的是边表格还是点表格

(3)点击模块化
这里写图片描述

(4)设置参数为0.4
这里写图片描述

(5)选择节点的渲染方式为Modularity Class
这里写图片描述
(6)得到football的社区划分和真实社区对比

football数据集通过gephi进行社区划分的结果(不带有边的图)
这里写图片描述
football数据集真实社区的结果(不带有边的图)
这里写图片描述
football数据集通过gephi进行社区划分的结果(带有边的图)
这里写图片描述
football数据集真实社区的结果(带有边的图)
这里写图片描述

根据上述的结果我们可以对比得到gephi生成的社区和真实社区的差别,并且最终得到如下所示的两张对比图片。

gephi基于模块度生成社区划分的图片
这里写图片描述
football给出的标签的真实社区图片
这里写图片描述
football数据集以及相关数据集下载地址
CSDN下载链接

这篇关于Football数据集可视化处理——gephi可视化处理数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/154135

相关文章

Python+FFmpeg实现视频自动化处理的完整指南

《Python+FFmpeg实现视频自动化处理的完整指南》本文总结了一套在Python中使用subprocess.run调用FFmpeg进行视频自动化处理的解决方案,涵盖了跨平台硬件加速、中间素材处理... 目录一、 跨平台硬件加速:统一接口设计1. 核心映射逻辑2. python 实现代码二、 中间素材处

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

《MySQL快速复制一张表的四种核心方法(包括表结构和数据)》本文详细介绍了四种复制MySQL表(结构+数据)的方法,并对每种方法进行了对比分析,适用于不同场景和数据量的复制需求,特别是针对超大表(1... 目录一、mysql 复制表(结构+数据)的 4 种核心方法(面试结构化回答)方法 1:CREATE

Go异常处理、泛型和文件操作实例代码

《Go异常处理、泛型和文件操作实例代码》Go语言的异常处理机制与传统的面向对象语言(如Java、C#)所使用的try-catch结构有所不同,它采用了自己独特的设计理念和方法,:本文主要介绍Go异... 目录一:异常处理常见的异常处理向上抛中断程序恢复程序二:泛型泛型函数泛型结构体泛型切片泛型 map三:文

详解C++ 存储二进制数据容器的几种方法

《详解C++存储二进制数据容器的几种方法》本文主要介绍了详解C++存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::ve... 目录1.std::vector<uint8_t>(最常用)特点:适用场景:示例:2.std::arra

SpringSecurity中的跨域问题处理方案

《SpringSecurity中的跨域问题处理方案》本文介绍了跨域资源共享(CORS)技术在JavaEE开发中的应用,详细讲解了CORS的工作原理,包括简单请求和非简单请求的处理方式,本文结合实例代码... 目录1.什么是CORS2.简单请求3.非简单请求4.Spring跨域解决方案4.1.@CrossOr

MySQL中的DELETE删除数据及注意事项

《MySQL中的DELETE删除数据及注意事项》MySQL的DELETE语句是数据库操作中不可或缺的一部分,通过合理使用索引、批量删除、避免全表删除、使用TRUNCATE、使用ORDERBY和LIMI... 目录1. 基本语法单表删除2. 高级用法使用子查询删除删除多表3. 性能优化策略使用索引批量删除避免

requests处理token鉴权接口和jsonpath使用方式

《requests处理token鉴权接口和jsonpath使用方式》文章介绍了如何使用requests库进行token鉴权接口的处理,包括登录提取token并保存,还详述了如何使用jsonpath表达... 目录requests处理token鉴权接口和jsonpath使用json数据提取工具总结reques

MySQL 数据库进阶之SQL 数据操作与子查询操作大全

《MySQL数据库进阶之SQL数据操作与子查询操作大全》本文详细介绍了SQL中的子查询、数据添加(INSERT)、数据修改(UPDATE)和数据删除(DELETE、TRUNCATE、DROP)操作... 目录一、子查询:嵌套在查询中的查询1.1 子查询的基本语法1.2 子查询的实战示例二、数据添加:INSE

Linux服务器数据盘移除并重新挂载的全过程

《Linux服务器数据盘移除并重新挂载的全过程》:本文主要介绍在Linux服务器上移除并重新挂载数据盘的整个过程,分为三大步:卸载文件系统、分离磁盘和重新挂载,每一步都有详细的步骤和注意事项,确保... 目录引言第一步:卸载文件系统第二步:分离磁盘第三步:重新挂载引言在 linux 服务器上移除并重新挂p

使用MyBatis TypeHandler实现数据加密与解密的具体方案

《使用MyBatisTypeHandler实现数据加密与解密的具体方案》在我们日常的开发工作中,经常会遇到一些敏感数据需要存储,比如用户的手机号、身份证号、银行卡号等,为了保障数据安全,我们通常会对... 目录1. 核心概念:什么是 TypeHandler?2. 实战场景3. 代码实现步骤步骤 1:定义 E