IMDB评分标准

2023-10-08 20:50
文章标签 imdb 评分标准

本文主要是介绍IMDB评分标准,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

IMDB是美国一个权威的电影网站,除了详尽的资料外,一个特色是上面给影片做了评分。这些分数根据复杂的规则得出,不光有专业工作人员对影片打分,也允许普通影迷给电影评分,当投票人数较多的时候,我们可以认为,影片的得分可以比较客观地反映影片的质量。当然由于他是一个英文网站,这也使得非英语影片受到的关注较少。

 

 

上图截至是2007-7-20时,IMDB上对《料理鼠王》评分的所有打分者的条状统计图。

从中我们可以看到各个分数段的大致比例,比如这儿就可以发现,超过一半的人是打满分的。
图下面有两个分值,一个是算术平均值(arithmetic mean),一个是中值(median)。算术平均值大概就是平均数,中值是统计学中的中间数值,该值和比它大及比它小的数值是等差的。而最后我们查到的分数却既不是算术平均值,也不是中值。

imdb top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下:
    

      weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C

其中:

      R = average for the movie (mean) = (Rating) (是用普通的方法计算出的平均分)

      v = number of votes for the movie = (votes) (投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)
      m = minimum votes required to be listed in the top 250 (currently 1250) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
      C = the mean vote across the whole report (currently 6.9) (目前所有电影的平均得分)
  

  (这个公式应该可以用在其他的评分应用上,像书评、app store等, 目前,我还没弄懂这个公式的参数的获得方式, 有时间再看看)


另外重点来了,根据这个注释:

      note: for this top 250, only votes from regular voters are considered.

      只有'regular voters'的投票才会被计算在IMDB top 250之内,这就是IMDB防御因为某种电影的fans拉票而影响top 250结果,把top 250尽量限制在资深影迷投票范围内的主要方法。regular voter的标准不详,估计至少是“投票电影超过xxx部以上”这样的水平,搞不好还会加上投票的时间分布,为支持自己的心爱电影一天内给N百部电影投票估计也不行。

    

      简单的说,你的票不是没有算数,而是算了数但所占比重太低所以几乎不影响什么。IMDB的不同会员的票是不等值的~imdb内部有一个选择系统~貌似没公布过标准。据外界猜测,你所问的所谓真正的有效投票者,只出于长期参与投票会员,经确认的一些社会人士(相关专业背景),一般投票者的票在加权统计后,对分值影响很低的。身在中国的普通影迷是不可能成为这种正规投票者的,真想那么成为这种身份,你至少要把自身提升到业内人士的水平才行。

 

      因此,细心的人可以注意到,列入IMDB top 250的电影,其主页面上的分数与Top 250列表中的分数是不同的。以料理鼠王为例,它在自己的页面中的分数是8.6,而列表中是8.4。一般Top 250表中的得分都会低于自己页面中的得分,越是娱乐片差距越大。这大概是因为regular voter对于电影的要求通常较高的关系。

      而IMDB的过人之处不仅仅在于这儿,它除了给出分数,还给了一个更详细的投票人的列表:

 



      这个chart(图表)根据年龄、性别、国别等不同的情况,列出了不同的分数chart。而且你点击每个选项,上面(就是图一)都会出现一个不同的chart。这个其实是比较有用的。比如你在要选择动画片的时候,就应该点选一下小于18岁,或者30-44岁这个选项看看他们的评分,因为他们才是这部电影的最大观众群,其他人的分数都是仅供参考的。

      我们在选择影片的时候,可以不仅仅看个总得分,多花一点时间,看看影片各个年龄段的得分会更有帮助的。有些影片我们觉得不好看,但是分数很高,你也可以参照一下,“us users”和“non-us users”这部分的数据,如果美国投票用户远远大于海外用户,那说明此片的确是有相当重的美国文化底蕴的,不觉得好看也是正常。相反的,如果我们觉得不错,但是IMDB的分数很低,这也许是老美的评分人数多,打的分低,就把总分给拉下来了。

这篇关于IMDB评分标准的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/167903

相关文章

《雅思口语真经总纲1.0》笔记——第二章:官方评分标准真经——Lexical Resource 词汇资源——三十个动词词组

文章目录 第二章:官方评分标准真经Lexical Resource 词汇资源三十个动词词组back sb.up支持某人break up 分手词汇 Key Words call sth.off 取消某事not care for sth.不喜欢某事cheer(sb.)up (使某人)高兴起来come across 偶然遇到/碰到run into sb. 偶然遇到某人cut down on s

《雅思口语真经总纲1.0》笔记——第二章:官方评分标准真经——Lexical Resource 词汇资源——三十组同义形容词列表

文章目录 第二章:官方评分标准真经Lexical Resource 词汇资源三十组同义形容词列表1 难常见词汇:hard, difficult非常见词汇:tough, tricky 2 简单常见词汇:easy非常见词汇:effortless 3 富有常见词汇:rich, wealthy非常见词汇:affluent, well-to-do 4 好常见词汇:good非常见词汇:awesome

course-nlp——5-nn-imdb

本文参考自https://github.com/fastai/course-nlp。这部分是fastai1.0版本的教程,由于现在fastai2.0重构的改变非常大,所以文中的很多api都变了,由于学习目的并不是熟练掌握fastai,因此这里就简单的存一下,本文是用IMDB电影评论数据集在wikitext-103语言模型中微调,构建语言模型和情感分类器。 自然语言建模的迁移学习 为 IMDB

《雅思口语真经总纲1.0》笔记——第二章:官方评分标准真经——Fluency Coherence 流利度和连贯性(1、连贯性)

文章目录 第二章:官方评分标准真经Fluency & Coherence 流利度和连贯性连贯性因果连接首先其次Q:What are the benefts of travelling?词汇 Key Words 比如和等等代词定语从句(who、which\、where)Q:Who’s your favourite celebrity?词汇 Key Words Q:What outdoor

【深度学习】IMDB数据集上电影评论二分类

任务描述 根据电影评论的文字内容来将电影划分为正面或者负面。 IMDB数据集 50000条两级分化的评论。正面负面各为50%。 # 加载数据from keras.datasets import imdb(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000) # 仅保留训

基于 BERT 对 IMDB 电影评论进行情感分类

前言 系列专栏:【深度学习:算法项目实战】✨︎ 涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域,讨论了各种复杂的深度神经网络思想,如卷积神经网络、循环神经网络、生成对抗网络、门控循环单元、长短期记忆、自然语言处理、深度强化学习、大型语言模型和迁移学习。 BERT 是 Bidirectional Representatio

【雅思写作】刘洪波——《最简化雅思写作2.0》笔记——【2. 大作文篇】第一章:被忽视的金矿——官方评分标准

文章目录 第一章:被忽视的金矿——官方评分标准第一节:跟我一起挖金矿首先看表头要重点学习7分的评分标准1. 7分的Task Response2. 7分的Coherence and Cohesion3. 7分的Lexical Resource4. 7分的Grammatical Range and Accuracy 目前还没有细化到0.5分的评分标准 第二节:考官是怎样给这份考卷打出5分的

Tensorflow2.0笔记 - 循环神经网络RNN做IMDB评价分析

本笔记记录使用SimpleRNNCell做一个IMDB评价系统情感二分类问题的例子。 import osimport timeimport numpy as npimport tensorflow as tffrom tensorflow import kerasfrom tensorflow.keras import datasets, layers, optimiz

考研英语作文评分标准大揭秘!摸透套路才能拿分!

一般评分标准(英语一) 1、第一档 A 节(9-10分)B 节(17-20 分) 很好地完成了试题规定的任务 包含所有内容要点;使用丰富的语法结构和词汇;语言自然流畅,语法错误极少;有效地采用了多种衔接手法,文字连贯,层次清晰;格式与语域恰当、贴切;对目标读者完全产生了预期的效果。 2、第二档 A 节(7-8 分)B 节(13-16 分) 较好地完成了试题规定的任务 包含所有内容要点,允许漏掉

监控系统的评分标准

一、监控概念 监控是有效管理基础设施和业务的关键工具。正确的监控应当与应用程序一同构建和部署,因为缺乏监控会导致对系统运行环境的不了解,阻碍故障诊断,以及无法及时获取关键的性能、成本和状态等信息。 然而,我们需要注意一些监控中的误区: ● 机械式监控:避免过于机械和生硬的监控方法,应当采用更灵活、智能的监控方式。 ● 不够准确的监控:监控系统应当具备高准确性,以确保获得真实、可信的监控数据,避