IMDB评分标准

2023-10-08 20:50

文章标签 imdb 评分标准

本文主要是介绍IMDB评分标准，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

IMDB是美国一个权威的电影网站，除了详尽的资料外，一个特色是上面给影片做了评分。这些分数根据复杂的规则得出，不光有专业工作人员对影片打分，也允许普通影迷给电影评分，当投票人数较多的时候，我们可以认为，影片的得分可以比较客观地反映影片的质量。当然由于他是一个英文网站，这也使得非英语影片受到的关注较少。

上图截至是2007-7-20时，IMDB上对《料理鼠王》评分的所有打分者的条状统计图。

从中我们可以看到各个分数段的大致比例，比如这儿就可以发现，超过一半的人是打满分的。
图下面有两个分值，一个是算术平均值（arithmetic mean），一个是中值（median）。算术平均值大概就是平均数，中值是统计学中的中间数值，该值和比它大及比它小的数值是等差的。而最后我们查到的分数却既不是算术平均值，也不是中值。

imdb top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR)，公式如下：

weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C

其中：

R = average for the movie (mean) = (Rating) （是用普通的方法计算出的平均分）

      v = number of votes for the movie = (votes) （投票人数，需要注意的是，只有经常投票者才会被计算在内，这个下面详细解释）
      m = minimum votes required to be listed in the top 250 (currently 1250) （进入imdb top 250需要的最小票数，只有三两个人投票的电影就算得满分也没用的）
      C = the mean vote across the whole report (currently 6.9) （目前所有电影的平均得分）

（这个公式应该可以用在其他的评分应用上，像书评、app store等，目前，我还没弄懂这个公式的参数的获得方式，有时间再看看）

另外重点来了，根据这个注释：

note: for this top 250, only votes from regular voters are considered.

只有'regular voters'的投票才会被计算在IMDB top 250之内，这就是IMDB防御因为某种电影的fans拉票而影响top 250结果，把top 250尽量限制在资深影迷投票范围内的主要方法。regular voter的标准不详，估计至少是“投票电影超过xxx部以上”这样的水平，搞不好还会加上投票的时间分布，为支持自己的心爱电影一天内给N百部电影投票估计也不行。

简单的说，你的票不是没有算数，而是算了数但所占比重太低所以几乎不影响什么。IMDB的不同会员的票是不等值的~imdb内部有一个选择系统~貌似没公布过标准。据外界猜测，你所问的所谓真正的有效投票者，只出于长期参与投票会员，经确认的一些社会人士（相关专业背景），一般投票者的票在加权统计后，对分值影响很低的。身在中国的普通影迷是不可能成为这种正规投票者的，真想那么成为这种身份，你至少要把自身提升到业内人士的水平才行。

因此，细心的人可以注意到，列入IMDB top 250的电影，其主页面上的分数与Top 250列表中的分数是不同的。以料理鼠王为例，它在自己的页面中的分数是8.6，而列表中是8.4。一般Top 250表中的得分都会低于自己页面中的得分，越是娱乐片差距越大。这大概是因为regular voter对于电影的要求通常较高的关系。

而IMDB的过人之处不仅仅在于这儿，它除了给出分数，还给了一个更详细的投票人的列表：

这个chart(图表)根据年龄、性别、国别等不同的情况，列出了不同的分数chart。而且你点击每个选项，上面（就是图一）都会出现一个不同的chart。这个其实是比较有用的。比如你在要选择动画片的时候，就应该点选一下小于18岁，或者30－44岁这个选项看看他们的评分，因为他们才是这部电影的最大观众群，其他人的分数都是仅供参考的。

我们在选择影片的时候，可以不仅仅看个总得分，多花一点时间，看看影片各个年龄段的得分会更有帮助的。有些影片我们觉得不好看，但是分数很高，你也可以参照一下，“us users”和“non－us users”这部分的数据，如果美国投票用户远远大于海外用户，那说明此片的确是有相当重的美国文化底蕴的，不觉得好看也是正常。相反的，如果我们觉得不错，但是IMDB的分数很低，这也许是老美的评分人数多，打的分低，就把总分给拉下来了。