我们用Python列了一份十年漫威角色清单,请查收!

2023-10-21 03:30

本文主要是介绍我们用Python列了一份十年漫威角色清单,请查收!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

1240

网站是基于Graph技术开发的。

其实之前小F也利用了有关Graph的库实现了一波人物的关系分析。

只不过分析结果比较粗糙而已~

下面是网站的概况,大家可以一览。

1240


在这里还是要推荐下我自己建的Python开发学习群:[304][050][799],群里都是学Python开发的,如果你正在学习Python ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2018最新的Python进阶资料和高级开发教程,欢迎进阶中和进想深入Python的小伙伴!

1240

那么人家能做出这么酷炫的关系图,我们自己能不能实现呢?

这一期就利用网站提供的数据,使用Neo4j(NOSQL图形数据库)进行实战一波。

/ 01 / 获取分析

人物及人物关联信息从网站上获取,具体接口如下。

1240

数据为json格式,分别在「characters」和「relationship」中。

1240

这里的信息是分别指托尼·斯达克,关系「0」为朋友斯蒂文·罗杰斯

1240

/ 02 / 数据获取

具体代码如下。

import json

import requests

headers = {

'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'

}

url = 'https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/data/marvel-data.json'

response = requests.get(url=url, headers=headers)

result = json.loads(response.text)

num = 0

names =

item = {0: 'friend', 1: 'enemy', 2: 'creation', 3: 'family', 4: 'work', 5: 'love'}

for i in result['relationship']:

subject = result['relationship'][i]['id']

object = result['relationship'][i]['target_id']

if subject not in names:

names.append(subject)

if object not in names:

names.append(object)

relation = int(result['relationship'][i]['relationship'])

with open('relation_message.csv', 'a+') as f:

f.write(subject + ',' + object + ',' + item[relation] + '

')

for j in names:

num += 1

with open('names_message.csv', 'a+') as f:

f.write(j + ',' + str(num) + '

')

for k in result['characters']:

id = result['characters'][k]['id']

name = result['characters'][k]['name']

status = result['characters'][k]['status']

species = result['characters'][k]['species']

with open('message.csv', 'a+') as f:

f.write(id + ',' + name + ',' + status + ',' + species + '

')

最后成功获取数据。

1240

人物名为简称,共计182个人物。

1240

1144条人物关系数据,4大类型。

下面是182个人物的一些详情信息。

1240

包含了人物的名字及简称,存活状态,人物属性。

/ 03 / 数据可视化

下面通过Neo4j对人物关系进行可视化。

Neo4j的安装这里就不细说了,大家可以自行百度。

开启Neo4j服务后,登陆Neo4j网站,初始化界面如下。

1240

先加载第一个文件。

1240

具体代码如下。

LOAD CSV WITH HEADERS FROM 'file:///names_message.csv' AS data CREATE (:people{name:data.name, id:data.id});

下面加载第二个文件。

1240

具体代码如下。

LOAD CSV WITH HEADERS FROM "file:///relation_message.csv" AS relations

MATCH (entity1:people{name:relations.subject}) , (entity2:people{name:relations.object})

CREATE (entity1)-[:rel{relation: relations.relation}]->(entity2)

点击1144按钮处,取消限制数,再点击全屏。

1240

1240

1240

这里大致能看出来漫威的人物聚集情况。

第一大反派灭霸(thanos),原来这么孤立的。

这里由于人物太多,造成观察不便,所以对结果进行一些筛选。

比如筛选托尼·斯达克的朋友,运行下面的代码。

match p=(n:people{name:"tonys"})-[:rel{relation:"friend"}]-> return p;

得到下图结果。

1240

其中「thor」为「雷神」,「stever」为「美队」,「blackw」为「黑寡妇」,「vision」为「幻视」,「peterp」为「蜘蛛侠」,「bruceb」为「绿巨人」。

下面再来看一下美队的女友吧。

1240

佩吉·卡特和她的侄女莎朗·卡特,据说两人样貌极为相像。

/ 04 / 总结

本次只是对Neo4j的一些简单操作,后期或许会去深入了解。

此外漫威的这些人物信息,还可以玩出很多花样的。

也希望大家能去动手尝试尝试,做一枚硬核铁粉~

-The End-

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

将门创新服务专注于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。

将门技术社群专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。

将门创投基金专注于投资通过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括机器智能、物联网、自然人机交互、企业计算。在三年的时间里,将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、宽拓科技、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。

转载于:https://my.oschina.net/u/3839556/blog/3044379

这篇关于我们用Python列了一份十年漫威角色清单,请查收!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/251605

相关文章

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

Python 字符串占位

在Python中,可以使用字符串的格式化方法来实现字符串的占位。常见的方法有百分号操作符 % 以及 str.format() 方法 百分号操作符 % name = "张三"age = 20message = "我叫%s,今年%d岁。" % (name, age)print(message) # 我叫张三,今年20岁。 str.format() 方法 name = "张三"age

一道经典Python程序样例带你飞速掌握Python的字典和列表

Python中的列表(list)和字典(dict)是两种常用的数据结构,它们在数据组织和存储方面有很大的不同。 列表(List) 列表是Python中的一种有序集合,可以随时添加和删除其中的元素。列表中的元素可以是任何数据类型,包括数字、字符串、其他列表等。列表使用方括号[]表示,元素之间用逗号,分隔。 定义和使用 # 定义一个列表 fruits = ['apple', 'banana

Python应用开发——30天学习Streamlit Python包进行APP的构建(9)

st.area_chart 显示区域图。 这是围绕 st.altair_chart 的语法糖。主要区别在于该命令使用数据自身的列和指数来计算图表的 Altair 规格。因此,在许多 "只需绘制此图 "的情况下,该命令更易于使用,但可定制性较差。 如果 st.area_chart 无法正确猜测数据规格,请尝试使用 st.altair_chart 指定所需的图表。 Function signa

python实现最简单循环神经网络(RNNs)

Recurrent Neural Networks(RNNs) 的模型: 上图中红色部分是输入向量。文本、单词、数据都是输入,在网络里都以向量的形式进行表示。 绿色部分是隐藏向量。是加工处理过程。 蓝色部分是输出向量。 python代码表示如下: rnn = RNN()y = rnn.step(x) # x为输入向量,y为输出向量 RNNs神经网络由神经元组成, python

python 喷泉码

因为要完成毕业设计,毕业设计做的是数据分发与传输的东西。在网络中数据容易丢失,所以我用fountain code做所发送数据包的数据恢复。fountain code属于有限域编码的一部分,有很广泛的应用。 我们日常生活中使用的二维码,就用到foutain code做数据恢复。你遮住二维码的四分之一,用手机的相机也照样能识别。你遮住的四分之一就相当于丢失的数据包。 为了实现并理解foutain

python 点滴学

1 python 里面tuple是无法改变的 tuple = (1,),计算tuple里面只有一个元素,也要加上逗号 2  1 毕业论文改 2 leetcode第一题做出来

Python爬虫-贝壳新房

前言 本文是该专栏的第32篇,后面会持续分享python爬虫干货知识,记得关注。 本文以某房网为例,如下图所示,采集对应城市的新房房源数据。具体实现思路和详细逻辑,笔者将在正文结合完整代码进行详细介绍。接下来,跟着笔者直接往下看正文详细内容。(附带完整代码) 正文 地址:aHR0cHM6Ly93aC5mYW5nLmtlLmNvbS9sb3VwYW4v 目标:采集对应城市的

python 在pycharm下能导入外面的模块,到terminal下就不能导入

项目结构如下,在ic2ctw.py 中导入util,在pycharm下不报错,但是到terminal下运行报错  File "deal_data/ic2ctw.py", line 3, in <module>     import util 解决方案: 暂时方案:在终端下:export PYTHONPATH=/Users/fujingling/PycharmProjects/PSENe

将一维机械振动信号构造为训练集和测试集(Python)

从如下链接中下载轴承数据集。 https://www.sciencedirect.com/science/article/pii/S2352340918314124 import numpy as npimport scipy.io as sioimport matplotlib.pyplot as pltimport statistics as statsimport pandas