Football数据集可视化处理——gephi可视化处理数据

2023-10-06 21:59

本文主要是介绍Football数据集可视化处理——gephi可视化处理数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

#1 football数据集的文件格式
根据如图所示football数据集和的文件格式如下所示:
下图表示football数据集节点部分信息
这里写图片描述
下图表示football数据集边的部分信息
这里写图片描述
根据上述两个图中的格式对football数据集的格式介绍可以介绍为如下所示:

Creator "Mark Newman on Sat Jul 22 05:32:16 2006"
graph
[node[id **value **label ****]...node[id **value **label ****]edge[id **value **label ****]...edge[id ***value **label ****]
]

#2 football数据集文件格式的转化
根据上述的football文件,我们将数据文件转化成两个文件,这两个文件分别用来存储football数据集的边信息和节点信息,对football数据集文件的处理如下。
##2.1 football数据集节点信息文件
根据gephi通过csv导入信息的需要,我们将数据信息处理成如下的数据集节点文件格式:

Id Label Value
1  Tom   3
2  Bob   4

在football数据集中将football.gml文件处理得到的结果如下所示:
这里写图片描述
其中:

Id:用于标识唯一的一个点
Label:标识节点的标签或者是名称
Value:标识节点的所属的社区。

##2.2 football数据集边信息文件
根据gephi通过csv导入数据的格式,我们分为有向图和无向图两种数据格式,对于有向图的导入数据格式如下所示:

Source Target Weight
1 3 2
2 4 1
根据上述公式:
Source:表示源节点
Target:表示目的结点
Weight:表示对应的边的权重

在无向图的导入中需要加入Type类型得出的数据格式如下所示:

Source Target Weigth Type
1 3 2 Undirected
2 4 1 Undirected

如下图所示为football数据集的数据个格式,football数据集是无权图因此没有有weight。
这里写图片描述

在football数据集的616条边中有三条边是重复出现的分别为

28 18
85 4
100 15

在通过gephi对这些边进行模块化社区划分运算的时候需要将这些边删除,否则无法运行。
##2.3 对football.gml处理代码

#include <iostream>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
using namespace std;int main()
{FILE* inputfile = NULL;FILE* nodefile = NULL;FILE* edgefile = NULL;inputfile = fopen("football.gml","r");nodefile = fopen("nodefile.txt","w");edgefile = fopen("edgefile.txt","w");fprintf(nodefile, "Id Label Value\n");fprintf(edgefile,"Source Target Type\n");char strLine[1024];int i = 0;int node = 0;int edge = 0;//char nodeinfo[100];char edgeinfo[100];while(!feof(inputfile)){fgets(strLine,1024, inputfile);if(strncmp(strLine+4,"id",2)==0 ){char id[5];char label[50];char value[5];memset(label,0,50);int idint = 0, valueint = 0;int copylen = 0;copylen = strlen(strLine) - 8;strncpy(id,strLine+7,copylen);idint = atoi(id)+1;fgets(strLine,1024, inputfile);copylen = strlen(strLine) - 13;strncpy(label,strLine+11,copylen);fgets(strLine,1024, inputfile);copylen = strlen(strLine) - 10;strncpy(value,strLine+10,copylen);valueint = atoi(value)+1;//cout << valueint << endl;fprintf(nodefile,"%d %s %d\n",idint,label,valueint);}if(strncmp(strLine+4,"source",6)==0){char target[5];char source[5];int sourceint = 0,targetint = 0;memset(target,0,5);memset(source,0,5);int copylen = 0;copylen = strlen(strLine)-12;strncpy(source,strLine+11,copylen);sourceint = atoi(source)+1;fgets(strLine,1024, inputfile);copylen = strlen(strLine)-12;strncpy(target,strLine+11,copylen);targetint = atoi(target)+1;fprintf(edgefile,"%d %d undirected\n",sourceint,targetint);}}fclose(nodefile);fclose(edgefile);return 0;
}

#3 gephi点表和边表的导入并生成football图像
(1)点击文件->Import spreadsheet如下图所示:
这里写图片描述

(2)选择需要导入的文件进行数据导入
这里写图片描述
注意选择导入的是边表格还是点表格

(3)点击模块化
这里写图片描述

(4)设置参数为0.4
这里写图片描述

(5)选择节点的渲染方式为Modularity Class
这里写图片描述
(6)得到football的社区划分和真实社区对比

football数据集通过gephi进行社区划分的结果(不带有边的图)
这里写图片描述
football数据集真实社区的结果(不带有边的图)
这里写图片描述
football数据集通过gephi进行社区划分的结果(带有边的图)
这里写图片描述
football数据集真实社区的结果(带有边的图)
这里写图片描述

根据上述的结果我们可以对比得到gephi生成的社区和真实社区的差别,并且最终得到如下所示的两张对比图片。

gephi基于模块度生成社区划分的图片
这里写图片描述
football给出的标签的真实社区图片
这里写图片描述
football数据集以及相关数据集下载地址
CSDN下载链接

这篇关于Football数据集可视化处理——gephi可视化处理数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/154135

相关文章

MySQL InnoDB引擎ibdata文件损坏/删除后使用frm和ibd文件恢复数据

《MySQLInnoDB引擎ibdata文件损坏/删除后使用frm和ibd文件恢复数据》mysql的ibdata文件被误删、被恶意修改,没有从库和备份数据的情况下的数据恢复,不能保证数据库所有表数据... 参考:mysql Innodb表空间卸载、迁移、装载的使用方法注意!此方法只适用于innodb_fi

Gin框架中的GET和POST表单处理的实现

《Gin框架中的GET和POST表单处理的实现》Gin框架提供了简单而强大的机制来处理GET和POST表单提交的数据,通过c.Query、c.PostForm、c.Bind和c.Request.For... 目录一、GET表单处理二、POST表单处理1. 使用c.PostForm获取表单字段:2. 绑定到结

mysql通过frm和ibd文件恢复表_mysql5.7根据.frm和.ibd文件恢复表结构和数据

《mysql通过frm和ibd文件恢复表_mysql5.7根据.frm和.ibd文件恢复表结构和数据》文章主要介绍了如何从.frm和.ibd文件恢复MySQLInnoDB表结构和数据,需要的朋友可以参... 目录一、恢复表结构二、恢复表数据补充方法一、恢复表结构(从 .frm 文件)方法 1:使用 mysq

mysql8.0无备份通过idb文件恢复数据的方法、idb文件修复和tablespace id不一致处理

《mysql8.0无备份通过idb文件恢复数据的方法、idb文件修复和tablespaceid不一致处理》文章描述了公司服务器断电后数据库故障的过程,作者通过查看错误日志、重新初始化数据目录、恢复备... 周末突然接到一位一年多没联系的妹妹打来电话,“刘哥,快来救救我”,我脑海瞬间冒出妙瓦底,电信火苲马扁.

golang获取prometheus数据(prometheus/client_golang包)

《golang获取prometheus数据(prometheus/client_golang包)》本文主要介绍了使用Go语言的prometheus/client_golang包来获取Prometheu... 目录1. 创建链接1.1 语法1.2 完整示例2. 简单查询2.1 语法2.2 完整示例3. 范围值

javaScript在表单提交时获取表单数据的示例代码

《javaScript在表单提交时获取表单数据的示例代码》本文介绍了五种在JavaScript中获取表单数据的方法:使用FormData对象、手动提取表单数据、使用querySelector获取单个字... 方法 1:使用 FormData 对象FormData 是一个方便的内置对象,用于获取表单中的键值

Python自动化处理手机验证码

《Python自动化处理手机验证码》手机验证码是一种常见的身份验证手段,广泛应用于用户注册、登录、交易确认等场景,下面我们来看看如何使用Python自动化处理手机验证码吧... 目录一、获取手机验证码1.1 通过短信接收验证码1.2 使用第三方短信接收服务1.3 使用ADB读取手机短信1.4 通过API获取

Python自动化Office文档处理全攻略

《Python自动化Office文档处理全攻略》在日常办公中,处理Word、Excel和PDF等Office文档是再常见不过的任务,手动操作这些文档不仅耗时耗力,还容易出错,幸运的是,Python提供... 目录一、自动化处理Word文档1. 安装python-docx库2. 读取Word文档内容3. 修改

Rust中的BoxT之堆上的数据与递归类型详解

《Rust中的BoxT之堆上的数据与递归类型详解》本文介绍了Rust中的BoxT类型,包括其在堆与栈之间的内存分配,性能优势,以及如何利用BoxT来实现递归类型和处理大小未知类型,通过BoxT,Rus... 目录1. Box<T> 的基础知识1.1 堆与栈的分工1.2 性能优势2.1 递归类型的问题2.2

Python使用Pandas对比两列数据取最大值的五种方法

《Python使用Pandas对比两列数据取最大值的五种方法》本文主要介绍使用Pandas对比两列数据取最大值的五种方法,包括使用max方法、apply方法结合lambda函数、函数、clip方法、w... 目录引言一、使用max方法二、使用apply方法结合lambda函数三、使用np.maximum函数