IMDB是目前全球互联网中最大的一个电影资料库,里面包括了几乎所有的电影,以及1982
年以后的电视剧集。IMDB的资料中包括了影片的众多信息,演员,片长,内容介绍,分级
,评论等,就个人买碟而言,很大程度上也是参考IMDB的得分。
而IMDB的得分又是如何来的呢?它的可靠性又有多少呢?让我们通过《魔戒1:护戒使者》
来做具体分析吧,先看上图:
这张图就是魔戒1的所有评分者的分数的一个条状统计图。
从中我们可以看到各个分数段的大致比例,比如这儿就可以发现,超过一半的人是打满分
的。
根据IMDB网站上公布的TOP250评分标准:
imdb top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下:
weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C
其中:
R = average for the movie (mean) = (Rating)
(是用普通的方法计算出的平均分)
v = number of votes for the movie = (votes)
(投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)
m = minimum votes required to be listed in the top 250 (currently 1250)
(进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
C = the mean vote across the whole report (currently 6.9)
(目前所有电影的平均得分)
另外重点来了,根据这个注释:
note: for this top 250, only votes from regular voters are considered.
只有‘regular voters‘的投票才会被计算在IMDB top 250之内,这就是IMDB防御因为某
种电影的fans拉票而影响 top 250结果,把top 250尽量限制在资深影迷投票范围内的主要
方法。regular voter的标准不详,估计至少是“投票电影超过xxx 部以上”这样的水平,
搞不好还会加上投票的时间分布,为支持自己的心爱电影一天内给N百部电影投票估计也不
行。
因此,细心的人可以注意到,列入IMDB top 250的电影,其主页面上的分数与250列表中的
分数是不同的。
年以后的电视剧集。IMDB的资料中包括了影片的众多信息,演员,片长,内容介绍,分级
,评论等,就个人买碟而言,很大程度上也是参考IMDB的得分。
而IMDB的得分又是如何来的呢?它的可靠性又有多少呢?让我们通过《魔戒1:护戒使者》
来做具体分析吧,先看上图:
这张图就是魔戒1的所有评分者的分数的一个条状统计图。
从中我们可以看到各个分数段的大致比例,比如这儿就可以发现,超过一半的人是打满分
的。
根据IMDB网站上公布的TOP250评分标准:
imdb top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下:
weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C
其中:
R = average for the movie (mean) = (Rating)
(是用普通的方法计算出的平均分)
v = number of votes for the movie = (votes)
(投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)
m = minimum votes required to be listed in the top 250 (currently 1250)
(进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
C = the mean vote across the whole report (currently 6.9)
(目前所有电影的平均得分)
另外重点来了,根据这个注释:
note: for this top 250, only votes from regular voters are considered.
只有‘regular voters‘的投票才会被计算在IMDB top 250之内,这就是IMDB防御因为某
种电影的fans拉票而影响 top 250结果,把top 250尽量限制在资深影迷投票范围内的主要
方法。regular voter的标准不详,估计至少是“投票电影超过xxx 部以上”这样的水平,
搞不好还会加上投票的时间分布,为支持自己的心爱电影一天内给N百部电影投票估计也不
行。
因此,细心的人可以注意到,列入IMDB top 250的电影,其主页面上的分数与250列表中的
分数是不同的。