豆瓣9.2分!17万条弹幕告诉你《沉默的真相》凭什么口碑高开暴走!

2023-11-09 11:11

本文主要是介绍豆瓣9.2分!17万条弹幕告诉你《沉默的真相》凭什么口碑高开暴走!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公众号后台回复“图书“,了解更多号主新书内容

作者:CDA数据分析师

来源:CDA数据分析师

 


 CDA数据分析师 出品  

作者:Mika

数据:真达  

【导读】

今天教大家用Python分析《沉默的真相》的17万条弹幕。公众号后台,回复关键字“沉默”获取完整数据。

距离上一部国产良心剧《隐秘的角落》刷屏还不到2个月,“秃头梗”、“爬山梗”还让人记忆犹新。

紧接着又一部爆款国产剧来了,那就是最近口碑炸裂的《沉默的真相》。

 

同样是来自爱奇艺针对悬疑短剧的“迷雾剧场”,《沉默的真相》根据紫金陈的小说《长夜难明》改编,讲述了检察官江阳历经多年,付出无数代价查清案件真相的故事。

 

开播当天《沉默的真相》在豆瓣开分8.8分,随着剧集的播出,该剧口碑势不可挡,一路走高,播出六集后,豆瓣评分冲到了9.2分,成功超越了它的前浪《隐秘的角落》。要知道,这种高开高走的趋势,在国产剧里是非常罕见的。

 

许多网友在最初刷剧时根本不信自己会哭,结果看到大结局才发现,这也太好哭了吧,看到主角江阳的舍命燃灯,真的让人哭出兰州拉面…

 

那么这部《沉默的真相》

到底为什么口碑能高开暴走?

凭什么成为年度压轴国剧? 

今天我们就用Python来带你解读

01

豆瓣 9.2分!

超越前浪《隐秘的角落》

 

上一部被称为年度爆款国剧的还是《隐秘的角落》,改编自紫金陈的推理小说--《坏小孩》,《隐秘的角落》一经播出就带着"小白船","爬山梗","秃头梗"热闹了一整个夏天。

在豆瓣已有78万余人进行评分,最终收官8.9分,是非常惊艳的成绩。

 

谁知仅过去2个月,又一部悬疑剧《沉默的角落》凭借着逆天的口碑火了!同样改编自作者紫金陈的小说《长夜难明》,一开播豆瓣就达到8.8分。随着播出分数越来越高,如今已有20万余人评分,高达9.2分,已经超过了前浪《隐秘的角落》。

 

豆瓣总体评分分析

近一步分析观众评分,我们发现:

 

92.8%的观众给出了五星满分,这口碑在国产剧中已经达到标杆的水准。

 

豆瓣短评词云

然后我们再看到豆瓣的短评词云。

我们可以看到,观众在短评中讨论最多的就是主角"江阳",他的坚定和执着真可谓可歌可泣。"演员的演技","剧情",对"原著"的还原度,都得到了广泛的认可与好评。

 

02

刷剧《沉默的真相》

17万条弹幕都在说些什么

 

那么刷剧时,大家都在说些什么呢?接下来我们用Python分析了《沉默的真相》前10集的视频弹幕,共计173226条。

 

前十集弹幕走势图

从图中可以看到,看剧时大家都特别爱发弹幕,前十集中:

  • 弹幕数量最多分别是第9集,第3集和第10集,最多一集弹幕数为18903条

  • 弹幕最少的是第六集,弹幕数为15561条

 

接着我们再看看剧中主要角色的弹幕词云:

 

江阳弹幕词云

 

由白宇饰演的江阳,原本年轻有为,但是为了探求真相坚持正义,付出了自己的生命。像"正义"、"厉害"、"演技"等都在词云中频频出现。

 

李静弹幕词云

关于谭卓饰演的李静,在刷剧时很多人都会联想到她在《延禧攻略》中高贵妃的角色。无论是从“高贵妃”到《我不是药神》中的刘思慧,还是这次的李静,谭卓的演技都让人有目共睹。

 

严良弹幕词云

从最初官宣影帝廖凡,就有不少观众表示冲着廖凡也得看《沉默的真相》,果不其然,剧集一播出,粉丝就夸他是“免检产品”,妥妥的~

 

张超弹幕词云

饰演张超的宁理老师是迷雾剧场的老朋友了,之前在《无罪之证》中他演的社会"丰田哥"人狠话不多,"反向抽烟"实在是太深入人心了。从《无证之罪》到《隐秘的角落》,再到《沉默的真相》,严良都换了三个人了,真是流水的严良,铁打的李丰田

 

03

手把手教你

如何用Python分析弹幕

我们使用Python获取并分析爱奇艺《沉默的真相》前十集的弹幕数据,整个数据分析的流程分为以下三个部分:

  1. 弹幕数据获取

  2. 数据读入和简单处理

  3. 数据可视化分析

 

1. 数据获取

关于爱奇艺的弹幕数据获取程序之前文章中已经做过阐述。

2. 数据读入和预处理

首先导入所需包,其中pandas用于数据读入和数据处理,os用于文件操作,jieba用于中文分词,pyecharts和stylecolud用于数据可视化。

# 导入库
import os  
import jieba
import pandas as pd from pyecharts.charts import Bar, Pie, Line, WordCloud, Page
from pyecharts import options as opts 
from pyecharts.globals import SymbolType, WarningType
WarningType.ShowWarning = Falseimport stylecloud
from IPython.display import Image

将爬取的数据存放在data文件夹下,使用os操作获取需要读取的csv文件列表并循环读入文件。

# 读入数据
data_list = os.listdir('../data/')df_all = pd.DataFrame()for i in data_list:if i.endswith('csv'):df_one = pd.read_csv(f'../data/{i}', engine='python', encoding='utf-8', index_col=0)  df_all = df_all.append(df_one, ignore_index=False)print(df_all.shape) 
(173226, 6)

弹幕数量一共有173226条,预览一下数据:

df_all['name'] = df_all.name.str.strip() 
df_all.head() 

3. 数据可视化

分集的弹幕数

代码解说:

repl_list = {'第一集 ': 1,'第二集': 2,'第三集': 3,'第四集': 4,'第五集': 5,'第六集': 6,'第七集': 7,'第八集': 8,'第九集': 9,'第十集': 10
}df_all['episodes_num'] = df_all['episodes'].map(repl_list) 
df_all.head() 

# 产生数据
danmu_num = df_all.episodes_num.value_counts()
danmu_num = danmu_num.sort_index()
x_data = ['第' + str(i) + '集' for i in danmu_num.index]
y_data = danmu_num.values.tolist() # 条形图
bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1.add_xaxis(xaxis_data=x_data)
bar1.add_yaxis('', y_axis=y_data)
bar1.set_global_opts(title_opts=opts.TitleOpts(title='前十集的弹幕数走势图'), visualmap_opts=opts.VisualMapOpts(max_=20000, is_show=False) )
bar1.render() 
x_data = ['第' + str(i) + '集' for i in danmu_num.index]
y_data = danmu_num.values.tolist() # 条形图
bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1.add_xaxis(xaxis_data=x_data)
bar1.add_yaxis('', y_axis=y_data)
bar1.set_global_opts(title_opts=opts.TitleOpts(title='前十集的弹幕数走势图'), visualmap_opts=opts.VisualMapOpts(max_=20000, is_show=False) )
bar1.render('../html/爱奇艺弹幕数走势图.html') 

弹幕角色-江阳 词云图

# 定义分词函数
def get_cut_words(content_series):# 读入停用词表stop_words = [] with open(r"stop_words.txt", 'r', encoding='utf-8') as f:lines = f.readlines()for line in lines:stop_words.append(line.strip())# 添加关键词my_words = ['廖凡', '严良', '白宇', '江阳', '谭卓', '李静','宁理', '张超', '黄尧', '张晓倩', '奥利给']  for i in my_words:jieba.add_word(i) # 自定义停用词my_stop_words = ['真的', '这部', '这是', '一种', '那种', '啊啊啊', '哈哈哈', '哈哈哈哈', '我要']    stop_words.extend(my_stop_words)               # 分词word_num = jieba.lcut(content_series.str.cat(sep='。'), cut_all=False)# 条件筛选word_num_selected = [i for i in word_num if i not in stop_words and len(i)>=2]return word_num_selected
# 获取分词结果
text1 = get_cut_words(content_series=df_all[df_all.name=='江阳']['content'])# 绘制词云图
stylecloud.gen_stylecloud(text=' '.join(text1), max_words=1000,collocations=False,font_path=r'‪C:\Windows\Fonts\msyh.ttc',icon_name='fas fa-heart',size=653,output_name='弹幕角色-江阳词云图.png') 

公众号后台回复关键字“沉默” 

获取详细数据代码

◆ ◆ ◆  ◆ ◆
麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用原价4.45折的预购价格购买,还是非常划算的:点击下方小程序即可进入购买页面:
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。管理员二维码:猜你喜欢● 麟哥拼了!!!亲自出镜推荐自己新书《数据分析师求职面试指南》● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗点击阅读原文,即可参与当当4.45折购书活动

这篇关于豆瓣9.2分!17万条弹幕告诉你《沉默的真相》凭什么口碑高开暴走!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/375757

相关文章

17.用300行代码手写初体验Spring V1.0版本

1.1.课程目标 1、了解看源码最有效的方式,先猜测后验证,不要一开始就去调试代码。 2、浓缩就是精华,用 300行最简洁的代码 提炼Spring的基本设计思想。 3、掌握Spring框架的基本脉络。 1.2.内容定位 1、 具有1年以上的SpringMVC使用经验。 2、 希望深入了解Spring源码的人群,对 Spring有一个整体的宏观感受。 3、 全程手写实现SpringM

充电宝哪个牌子好?哪个充电宝质量好且耐用?六款口碑好充电宝

现如今大家都离不开电子设备,出门必备一款充电宝,如果手机、电脑没电了还能及时得到一个续航,恢复正常出行,但是说实话现在市面上的充电宝品类层次不齐,有些价格高但是品质一般,有些价格性价比可能会更高一点,但是却很少人知道,大家往往都去追求价格高的充电宝却忽略了自己选购充电宝的一个需求,盲目跟风入手的充电宝很大一部分是不适合自己的,今天小编就把自己多年来选购充电宝的一些小技巧分享给大家!以便大家选购合适

【Qt6.3 基础教程 17】 Qt布局管理详解:创建直观和响应式UI界面

文章目录 前言布局管理的基础为什么需要布局管理器? 盒布局:水平和垂直排列小部件示例:创建水平盒布局 栅格布局:在网格中对齐小部件示例:创建栅格布局 表单布局:为表单创建标签和字段示例:创建表单布局 调整空间和伸缩性示例:增加弹性空间 总结 前言 当您开始使用Qt设计用户界面(UI)时,理解布局管理是至关重要的。布局管理不仅关系到UI的外观,更直接影响用户交互的体验。本篇博

OpenGL3.3_C++_Windows(17)

Demo演示 demo演示 绘制不同的图元(点,线…):  理解 glDrawArrays 和 glDrawElements的区别 glDrawArrays :渲染的图元模式mode(可以参考),起始位置,顶点数量glDrawElements渲染的图元模式mode,顶点数量,元素类型。元素索引数组glDrawArrays 不使用索引进行绘制,glDrawElements会使

LeetCode 每日一题 2024/6/17-2024/6/23

记录了初步解题思路 以及本地实现代码;并不一定为最优 也希望大家能一起探讨 一起进步 目录 6/17 522. 最长特殊序列 II6/18 2288. 价格减免6/19 2713. 矩阵中严格递增的单元格数6/20 2748. 美丽下标对的数目6/21 LCP 61. 气温变化趋势6/22 2663. 字典序最小的美丽字符串6/23 520. 检测大写字母 6/1

Scrapy实战-下载豆瓣图书封面

紧接着再识Scrapy-爬取豆瓣图书,我们打算把每一本图书的封面都爬下来,毕竟下载图片是一件很棒的事。可以凭借这招去搜集各种表情包呢,还可以省了在某榴辛辛苦苦一个一个打开网页的烦恼呢。 根据官方文档,下载图片其实pipeline.py的额外工作而已,大致分为以下几步 在Spider中,额外定义一个image_urls用来存放图片链接的 item;这个item会从spider中传递到pipelin

Scrapy实战-爬取豆瓣漫画

背景知识 (一)什么是Scrapy呢?Python上优秀的爬虫框架。什么是爬虫?可以看我的心得感悟,也可以自行谷歌百度。 (二)建议看下初识Scrapy的事前准备安装Scrapy。 (三)Selectors根据XPath和CSS表达式从网页中选择数据。XPath和CSS表达式是什么东西,我们不用太过于纠结,只需要知道可以使用它们在网页中选择数据。用法:利用chrome去复制所需数据的位置信息

机器学习周记(第四十四周:Robformer)2024.6.17~2024.6.23

目录 摘要ABSTRACT1 论文信息1.1 论文标题1.2 论文摘要1.3 论文引言1.4 论文贡献 2 论文模型2.1 问题描述2.2 Robformer2.2.1 Encoder2.2.2 Decoder 2.3 鲁棒序列分解模块2.4 季节性成分调整模块 摘要 本周阅读了一篇利用改进 Transformer 进行长时间序列预测的论文。论文模型为 Robformer ,其

Python中的爬虫实战:豆瓣图书爬虫

Python是当今最热门的编程语言之一,在不同的领域都得到了广泛的应用,如数据科学、人工智能、网络安全等。其中,python在网络爬虫领域表现出色,许多企业和个人利用python进行数据采集和分析。本篇文章将介绍如何使用python爬取豆瓣图书信息,帮助读者初步了解python网络爬虫的实现方法和技术。 首先,对于豆瓣图书信息爬虫,我们需要用到Python中的两个重要的库:urllib和beau

以豆瓣网为例,讲解restful api设计规范

什么是restful api 目前比较成熟的一套互联网应用程序的API设计理论 豆瓣电影api 应该尽量将API部署在专用域名之下 http://api.douban.com/v2/user/1000001?apikey=XXX应该将API的版本号放入URL http://api.douban.com/v2/user/1000001?apikey=XXX在RESTful架构中,每个网址