TIPS:本文共有 3509 个字,阅读大概需要 8 分钟。
IMDB的权威性来自于它庞大的用户基数还独特的计算方法也就是“贝叶斯计算法”,对评分者有一定要求,对恶意投票等都有相应预防措施。
贝叶斯计算法是一种非常复杂的计算方法。要想领悟这种算法的精妙之处,我们首先需要看一个例子:
电影A,十个人看过,全部评分均为10分;
电影B,十万个人看过,评分平均值为9.8分。
请问你愿意相信哪部电影更加优秀??贝叶斯算法的核心思想就是避免让电影A的最终得分会超过B。
具体是如果做到的呢?首先IMDB统计了目前数据库所有的电影的平均评分(为6.9),并且设定了一个基础人数(为1250人);然后每一部新片进入数据库后,都会先默认已经有1250人都打过6.9分了。在这1250个6.9分的基础上,再加上真正有多少人评的分,合起来求一个平均数即为IMDB的top 250最终得分。
一些细节我觉得有必要提一下:
1. TOP 250的影片都要求评价人数超过基础人数,以限制某些像民族性,小众性的电影挤进来了;
2. 考虑TOP 250排名的时候,只取那些经常投票的人的票以避免刷票;
3. 为什么一定要强调是TOP 250的排名。因为TOP 250的排名和IMDB的正常排名是不一样的算法。具体网站上正常排名是怎么算的对外保密了,所以不得而知。
最后补充一点个人理解:贝叶斯的这套算法相对国内的网站还是科学的多的。然而个人理解还是有一些小问题的:新上映的电影短时间内评分上不去。假设电影A是老牌经典电影,100万个人给了9分,最后得分9分;电影B只是10年前的经典电影,1万个人给了9.1分,最后得分将只有8.85。这点差距放在排名上其实是非常大的。所以说,IMDB的TOP 250肯定是好电影,但不是所有的好电影都能进入TOP 250。
imdb排行榜多长时间更新一次
评分方式
以《魔戒1:护戒使者》具体分析。图1为魔戒1的所有评分者的分数的一个条状统计图。 图1从中我们可以看到各个分数段的大致比例,比如这儿就可以发现,超过一半的人是打满分的。
图下面有两个分值,一个是算术平均值(arithmetic mean),一个是中值(median)。算术平均值大概就是平均数,中值是统计学中的中间数值,该值和比它大及比它小的数值是等差的。而最后我们查到的分数却既不是算术平均值,也不是中值。
IMDB的分数的计算方法应该不是就做一下平均就ok了,在它的网页上也提到了它的计算方法是保密的。不过imdb top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下:
weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C
其中:
R = average for the movie (mean) = (Rating) (是用普通的方法计算出的骄?郑?br>v = number of votes for the movie = (votes) (投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)
m = minimum votes required to be listed in the top 250 (currently 1250) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
C = the mean vote across the whole report (currently 6.9) (目前所有电影的平均得分)
另外重点来了,根据这个注释:
note: for this top 250, only votes from regular voters are considered.
只有"regular voters"的投票才会被计算在IMDB top 250之内,这就是IMDB防御因为某种电影的fans拉票而影响top 250结果,把top 250尽量限制在资深影迷投票范围内的主要方法。regular voter的标准不详,估计至少是“投票电影超过xxx部以上”这样的水平,搞不好还会加上投票的时间分布,为支持自己的心爱电影一天内给N百部电影投票估计也不行。
因此,细心的人可以注意到,列入IMDB top 250的电影,其主页面上的分数与250列表中的分数是不同的。以魔戒1为例,它在自己的页面 中的分数是8.8,而列表中是8.7。一般250表中的得分都会低于自己页面中的得分,越是娱乐片差距越大。这大概是因为regular voter对于电影的要求通常较高的关系。) 图2
而IMDB的过人之处不仅仅在于这儿,它除了给出分数,还给了一个更详细的投票人的列表(图2)
这个chart根据年龄、性别、国别等不同的情况,列出了不同的分数chart。而且你点击每个选项,上面(就是图一)都会出现一个不同的chart。这个其实是比较有用的。比如你在要选择动画片的时候,就应该点选一下小于18岁,或者30-44岁这个选项看看他们的评分,因为他们才是这部电影的最大观众群,其他人的分数都是仅供参考的。
碟报员或者我们在选择影片的时候,可以不仅仅看个总得分,多花一点时间,看看影片各个年龄段的得分会更有帮助的。有些影片我们觉得不好看,但是分数很高,你也可以参照一下,“us users”和“non-us users”这部分的数据,如果美国投票用户远远大于海外用户,那说明此片的确是有相当重的美国文化底蕴的,不觉得好看也是正常。相反的,如果我们觉得不错,但是IMDB的分数很低,这也许是老美的评分人数多,打的分低,就把总分给拉下来了。
从魔戒1的得分截图可以发现这部影片的确是各个年龄阶段都很喜欢,分数都打的很高的。
因此,排行榜是每时每刻都在变的,并不是多久更新一次
参考资料:百度百科
电影imdb是什么排行榜
互联网电影资料库(Internet Movie Database,简称IMDb)是一个关于电影演员、电影、电视节目、电视明星、电子游戏和电影制作的在线数据库。
250佳片是IMDb很受欢迎的特色,里面列出了注册用户投票选出的有史以来最佳250部电影。只有供影院播出的影片可以参加评选,而短片,纪录片,连续短剧和电视电影不在其列。用户在从"1"(最低)到"10"(最高)的范围内对影片评分。得分经过数学公式(登在列表末尾)的过滤而生成最后的评定。为了保护结果不受恶意投票的影响,数据库使用了数据过滤机制以及最小投票数量限制(目前为1250票),以得到“真实的贝叶斯概率结果”。并且,只有“经常投票的用户”的投票被记入结果,为保护公平性,成为该类用户的条件是保密的。
该榜因其综合广泛性以及不时的令人吃惊而受到瞩目。上榜的电影中有老电影比如大都会(Metropolis,1927年),也有新电影如盗梦空间(Inception,2010年)。有流行影片比如得到超过32万次投票的魔戒首部曲:魔戒现身(The Fellowship of the Ring,2001年),也有少有人问津的影片如不到1万张投票的小私家侦探(Sherlock Jr. 1924年)。排行榜包括了各种不同类型的电影如黑色影片双重保险(Double Indemnity,1944年);科幻片银翼杀手(Blade Runner,1983年);音乐片雨中曲(Singin" in the Rain,1952年);西部片黄金三镖客(Il buono, il brutto, il cattivo. 1966年);动画片机器人总动员(WALL·E,2008年)等等。榜上还有一些影片是本身并未大受好评但却在专注的影迷群体中有广泛的追随者的比如死亡幻觉(Donnie Darko,2001年)。迄今为止肖申克的救赎(台湾译名为"刺激1995")、教父、教父2为排名前三的电影,也是榜上仅有的评分超过9.0的影片。
这些条件是否能提供一个公正没有偏见的排行榜是有争议的。比如,新近上映的影片总是容易从一见钟情的影迷那里得到较高的评分,而这与成功影片应该经得起反复观赏的观念是不相符的。因此,有时新上映的影片冲进250最佳影片榜,甚至前100名,但随着更多观众的评分和重复观看后的评分而退出榜外的情景就十分常见了。另外一种对该榜的主要批评则是它反映的只是影片的受欢迎程度,并不体现对影片历史和艺术的客观知识。但实际上,在评论家年度评选和历史影片评选中名列前茅的影片通常在最佳250部影片中通常也都排名很高,让人不禁怀疑影评人与观众的观点是否真有那么不同。
在IMDb上还有最差的100部影片榜,用基本相同的方法投票产生。
我们转型不易,新知识内容立足于正能量、实用,觉得《imdb如何查看单集排行榜(为什么imdb的排行榜比豆瓣更权威)》对你有帮助,请留言收藏!