为什么豆瓣评分在哪里评一直没有评分,大家觉得能评多少分

这是最近做的一篇分析,希望大家帮我看看,不知道有什么问题? 有什么建议也欢迎指出~, 原文

文中涉及的交互式散点图:


不知道大家有没有这样的经历 —— 看了一部电影,但对豆瓣的评分并不认可

比如,之前看西游伏妖篇,我就很疑惑,为什么分数这么低?毕竟,周星驰是我很喜欢的导演

而且,评论区也出现了截然相反的评价

再比如最近的神奇女侠 Wonder Woman,虽然分数不错,但我并不觉得很好看

此外,一直以来也有“爱乐之城 /摔跤吧爸爸评分偏高了吗?”等类似的问题。所以,会想问 —— 为什么有的电影分数高 /低,但是我们并不认同?是不是豆瓣电影的分数有问题?

之前,从的角度分析过,比如赤壁 /让子弹飞,国内外的评价并不一致,但还有没有别的原因?

选取 , 的电影。限制豆瓣评分人数在 2W 以上,一方面讨论大家较为熟悉、主流的电影,另一方面也尽量减少水军等的影响。总共 815 部电影,评分分布如图

包括了很多大家熟悉的电影

仔细观察西游的评分,会发现和相同评分的电影(杜拉拉升职记)的分布差别很大。

两者评分相同,评价人数也很多( 20W, 17W ),但 5 星和 1 星的比例差别很大[1]。

  • 杜拉拉升职记:大家都觉得很一般,所以评分集中在了 3 星

  • 西游伏妖篇:同时有不少人觉得不错 /较差,在 1 星和 5 星有不少的分布。

也就是说,尽管两者(平均)分数相同,但是背后的看法非常不同,评分差异很大,这也正好对应了上面,西游出现两种截然相反的热评的情况。

2.2 怎么衡量评分差异

评分分布的差异,可以用方差来衡量,计算方法如下

也就是计算 评分偏离平均分的程度。下文使用标准差( STD ),方差开方即可。可以做出标准差( STD ) - 豆瓣评分( Rating )散点分布图[2]。为了便于比较,做标准差 97%范围线。

可以看到西游和杜拉拉升职记的 STD 差别确实很大,西游的标准差排在前 3% ,争议性是巨大的,而杜拉拉则小很多。 另外,还发现散点图的有两个特点

  • 收敛:分数越高(比如从 6 分到 10 分),STD 分布的范围越来越窄,值越来越小

  • 不对称: 理论上来说,这张图应该是关于 6 分对称的,因为颠倒一下评星的顺序( e.g. 5 星 -> 1 星, 4 星 -> 2 星),就能得到对称的 STD 值,但实际并不对称。

对于收敛,可以从平均分怎么计算出来的角度理解:平均分越高,占高分的比例越大,因此评分差异较小。至于不对称,后面再说。

这里,可以看到很多典型评价差异很大的电影,比如刺客聂隐娘一步之遥 等等都在这张图的上方,STD 很高

可以拿他们和 STD 较低的电影比较

这里可以问一个问题 —— 这些电影的分数相同,但同样好看 /不好看吗?

比如,刺客聂隐娘我 11的分数一样,但他们一样好看吗?

和前面的比较类似,刺客聂隐娘虽然评分较高,但其 5 星 /1 星和我 11 差别很大。为什么呢?大家可能早有耳闻,看评论,也能看到

可能的原因,是刺客聂隐娘画面极具美感,但另一方面,剧情却让人看不懂。所以评分上出现了较大的分歧。一步之遥也是类似,算是比较有名的例子了。

爸爸去哪儿,也能从评论中看到一些端倪

可能的原因是,一方面是娱乐性优秀,带着小孩看电影的家长观众们觉得很好,另一方面,有人觉得这不是电影,纯属圈钱。

通常,我们总是在讨论一部电影评分的高低,但这只是平均分,当大家看法一致的时候,这个分数会很有参考价值。但当评分差异很大( STD 很大)的时候,这个分数的作用就有限了

3.1 总共有几种形状?

从评分的分布,很容易想到关于

那么,电影的评分,会有多少种形状呢?

可以用 K-Means 来做。实际可以分很细,这里简单分成 6 种,比较有代表性,结果如下图

[注,高 STD 的电影因为其形状差异很大,并不适用于这个分类]

这些分布,相当于电影评分的典型形状,两头和中间对应了大家熟知的 P, b 和钟形分布

这可以部分解释,为什么散点图是非对称的 —— 因为有很多 4 星为主的电影,但很少有 2 星为主的电影。毕竟,大多时候给的评价都是一般( 3 星),或烂片( 1 星),很少会有电影“精确烂到 2 星”。

每个形状下,也能看到 STD 高 /低的电影,比如魔兽,爱乐之城等等。

依然可以问这个问题 —— 这些电影分数相同,但是同样好看吗?

爱乐之城, 虽然评分和萨利机长一样,都算典型的好电影了,但是打 5 星的明显比萨利机长多,也侧面说明了为什么有人疑惑其分数“是否偏高”。魔兽,则可能有粉丝加成的影响。其他电影不再具体讨论,大家可以自己分析~

还有一些奇怪形状的电影,比如人间·小团圆,小时代 4, 长城,并不属于上述任何一种典型分布

具体原因不得而知。但实际上,这是典型的混合分布的特征,也就是说,由几个分布叠加得到。

如果把最差评分和中等评分混合起来(各按 50%算),可以得到和上面非常相似的形状

那么,有没有可能真的是混合分布呢?

查看评论,不难发现,对于人间·小团圆,是 ZZ 因素导致了对其评分的极大差别。

小时代可能也是类似。有人看到郭小四就要打一星,另一方面,原著粉们则表示还算不错。

那么长城呢?可以查看近期的评价。需要注意的是,这时不太可能有水军了,因为这时候的分数对票房毫无意义。简单看一下前两页,发现 2-3 星居多

和当初的差评还是有差距的。更靠谱的当然是抓数据,不过豆瓣官方并没有公开相关的数据,这个以后有机会再补吧~ 延伸出来的问题是,恶评如流的电影,在下映之后,还会有那么多差评吗?

本文主要做了两件微小的工作

  • 用标准差( STD )展示了电影评分的差异情况,能看到不少评价差异很大的电影

  • 对评分的形状,用 K-Means 分类,可以看到评分形状的几大类型

回到我们最开始的问题 —— 为什么有的电影分数高 /低,但是我们并不觉得如此?是分数有问题吗 ?

原因在于,那只是个平均分而已

而有意思的也在于此 —— 大多数人在谈论豆瓣的评分的时候,都知道这是平均分,也都能看到分数的分布情况。而且大多数时候,这个平均分是有效的,因为大家的评价较为接近( STD 较小)

但是,很少有人注意到评分的分歧大小(即 STD 的大小)。所以,当看到一部 STD 很大的电影,平均分和我们感受不符时,我们疑惑了,进而觉得豆瓣的评分有问题。实际上,只是因为人们的评价差异太大( STD 太大),使平均分失去了意义而已。


最后,我在想,有没有可能给豆瓣评分旁边加上一个小标签?比如,对 STD 特别大的电影,在旁边加个“分歧警告”标签,注明“这部电影的评价差异水平达到了前 3%,平均分的参考意义较为有限”, 进一步还可以分开展示好评 /差评,向用户解释评价差异具体如何。这样或许能减少一些人们对(平均)评分的疑虑。

然后,分析有什么疏漏或者没讲清楚的地方,也欢迎大家指出~

[1] 这里采用的是豆瓣的评分柱状图,画法并不标准(占比最大为定宽),但适用于基本的比较

[2] 实际 STD 的尺度没有这么大。这样画图类似于把 STD 做规整化,更方便于比较。

另外,看到评论里又开始怼 LZ,怼西游伏妖,这里补充一下个人看法

西游的问题是各方面差异太大了,表演很差,故事较差,但是画面想象力爆棚

所以,也就能看到大家评论的分化情况,因为大家对这方面的看重点是不一样的。

全文其实就一个意思 —— **不是“你的评分 /口味是错的”,“我的看法是对的”,而是“你的看法是对的”,“我的看法也是对的”,** 只是大家对这部电影的看法差别太大了(由于各种各样的原因)。

大多数时候,大家对电影的看法趋同,对于豆瓣电影的分数认可,是因为一部电影的各个方面较为平均,大家的看法也会比较一致。但是出现**西游**,**刺客聂隐娘**等等这类长 /短板差异明显的电影的时候,产生较大的差异,简单的平局分也就失效了

  “中国电影评论学会网络影视评论委员会”日前在京成立,并发布《网络影评人七大公约》,被媒体称作是首个冠有“国字头”的网络影评团体,引发部分人对未来网络影评客观性的担忧。

  担任这个网络影评团体首届主任的是张颐武——北京大学中文系教授,评论家,文化学者。对于采访主题,张颐武也有自己的选择。一开始礼貌婉拒了,见记者不走,问:“你要采访什么内容”,得知是“电影”,张颐武一下子来了兴致:“电影好,聊聊电影可以,走!”

  于是,我们就从最近争议最大的《长城》聊起来。

  是否是“诅咒”有待探讨

  北青报:您看《长城》了吗?

  张颐武:看了,我还写了影评。这是一部大规模制作、国际水准的电影。可以说是中国大片和全球制作接轨的一次尝试,意义重大。

  北青报:但网上对《长城》的争议还是很大的。

  张颐武:片子的想象方式是超越历史的,有些细节没有历史根据,比如1000多年前就用英文跟宋朝人直接对话,从这样的细节来要求的话,肯定是要受到批评的。还有人说这片子没有主题,其实片中是带有面向全球的恐怖隐喻,容易让人联想到当下世界存在的恐怖主义,也不能简单地说没有主题。

  电影都是见仁见智,观众有不同的声音是正常的。有人因为这部片子没达到20亿而唾弃它,事实上2016年的票房环境,十多亿也是不错的成绩,说明观众还是有一定兴趣的。

  北青报:有微博大V针对这部影片公开说“张艺谋已死”,这样的评价您怎么看?

  张颐武:这句话可能有两层含义,一方面是指人生、生命,这就有对人不尊重的含义;另一方面是指艺术创作,创作乏味了。这两层含义就引起了不同的争议,当然,“死了”这个话,确实说得极端了一些。这种戏剧化的修辞,是否冲击了底线,是否属于对个人的诅咒,还有待探讨。

  谈“豆瓣电影评分”

  “豆瓣”也是提供服务的平台

  北青报:差不多同样时间段,“人民日报批评豆瓣评分”的文章被刷屏,那件事是怎么回事?

  张颐武:这件事我认为有一些误解,圈内也有开玩笑说这是“碰瓷”人民日报。当时传言是人民日报官方发声,批评了豆瓣评分。但事实是,这并不是人民日报的报道,而是人民日报客户端转载的其他报道,和人民日报批评是有相当的差异的。

  它反映了某些人的一种心态:总是要说人民日报或其他权威声音在批评网络影评言论,好像有人要网络影评不能说话。影评声音多样其实是社会的常态,往往电影业界、制片方等对一些影评比较焦虑,担心对行业和市场有影响。所以现在来看,这个事儿实际上就是业界声音和网络声音之间的碰撞。

  北青报:您平时看“豆瓣”的电影评分吗?

  张颐武:有时候也看,作为一个参考,豆瓣还是挺好的。

  北青报:豆瓣影评写得怎么样?

  张颐武:豆瓣等影评有些很精彩,分析得既生动又有很深的理解,对观众观影有很好的作用。现在有些越写越短了,以前豆瓣的长影评很多,现在长影评往往都靠后了,不太引起注意。当然,短的评论也可以写得很有意思。

  北青报:“豆瓣”、“猫眼”这样的评分体系怎么样?

  张颐武:电影评分体系这么些年也起到了一些作用,对观众观影有参考作用。但是也不排除有一些不客观的评分存在,豆瓣、猫眼也是“生意”,也是企业在做平台服务。有些评分和市场的表现却是背离的,评分很低,结果票房表现不错,评分高的,票房表现反而一般。所以说,评分体系也未必完全能够左右电影市场。

  整体来说,豆瓣主要影响的还是大都市观影人群,文艺青年。当这个影响扩散到普通人群、或者三四线人群,作用就有限了。

  谈“网络影评委员会”

  北青报:为什么想要成立这样一个组织?是因为“豆瓣影评事件”吗?

  张颐武:那倒不是,网络影评委员会已经筹备了一年多。这几年网络影评影响越来越大,对观众的影响也大。中国电影评论学会历来关注群众影评、业余影评,对这个新增部分当然很关注。

  现在成立跟“豆瓣影评事件”没有什么关系,更不是影评“国家队”。

  北青报:委员会的组织形式是什么样?现在有多少人?主要做什么?

  张颐武:其实就是中国电影评论学会下面的一个专业委员会,更像是一个同业学会,针对一些议题召开会议沟通研究。理事成员有十多人,除了理事成员,还会联系很多影评人。

  主要工作就是沟通和交流,电影业界与影评界总有点“敌视”的感觉,业界很怕网络影评一骂就没市场了,所以他们之间也需要一些沟通。还有就是不同影评人之间的交流,倾听不同的声音。

  北青报:交流太多,会变得“统一口径”吗?

  张颐武:目前来看,网络影评非常活跃,不可能同质化。另外,委员会成立就是为了发出不同的声音。就像导演一样,每个导演的作品都不一样,每个影评人写的影评也都不一样。导演协会一直存在,张艺谋和贾樟柯的片子就变成一个样子了吗?(笑)作家协会一直存在,刘震云和莫言的作品就变成一个风格了吗?

  评论者当然不会因为参加了一个协会,就写一样的评论,同质化不会因为学会的出现而出现。

  谈“网络影评人公约”

  影评人自律的基本底线不针对全体网民

  北青报:这七大公约怎么起草完成的?

  张颐武:其实就是委员会内部成员之间达成的共识,也没有太繁琐的起草过程,像“没看完电影不应该作评论,不应该使用网络暴力”这些都是基本底线。

  北青报:是不是意味着以后在网上发表影评会受到这七条的约束?

  张颐武:当然不是,不是针对全体网民的,是委员会成员对自己的自律,作为一个影评人,这七条都是基本底线。

  对普通观众当然不用这么要求。观众就算没看,想吐槽两句也正常。但比如你是一个有一定影响力,可以影响一群人的网络影评人,那么起码你应该看完这部片子再发表意见。

  北青报:什么样的人算是“网络影评人”?

  张颐武:网络影评人是在实践中逐渐形成,他持续在网上写影评,受到观众关注,目前来看这个群体还是很清楚的,主要是一些相对集中的意见领袖,他们是网民,同时也很有影响力。

  并不是每个观众都是“网络影评人”,看完电影随便写一句喜欢或者不喜欢,那是普通观众的感想,不是影评人的影评。

  北青报:公约中反复强调“专业”,怎么样算是“专业”?

  张颐武:对电影规律有一定了解,对电影的叙事方式、文化背景和艺术表现方式有了解,能够作比较深入的分析。这和随性看电影的观众还是稍有差别的。我们希望影评人是有一些素养的,对电影的艺术、运作有一定了解。

  没有绝对的理想状态

  北青报:委员会还有其他具体的工作安排吗?

  张颐武:除了交流沟通,还有对网络影评的研究和思考,维护影评人的权利、保护版权等,会逐步展开。

  北青报:以后会把“豆瓣”、“猫眼”这样的影评相关机构纳入进来吗?

  张颐武:成立大会的时候豆瓣的人来参加了,参加委员会并不是说会妨碍发表评论,没有“统一”或者“约束”。无论是平台还是影评人,肯定希望自己的影评更客观,委员会就是交流的平台。

  北青报:现在中国的影评环境怎么样?

  张颐武:总体很活跃,网络影评这个新增量更显出活力,观众也非常期望好的影评。但很多时候,一些言辞激烈吸引眼球的影评,声音就很大,大家就能听得到。说的比较客观的,分析复杂的,就没人看了,这是网上容易出现的情况,确实也存在“劣币驱逐良币”的现象。

  北青报:理想的影评圈应该是什么样的?

  张颐武:没有绝对的理想状态,就说说希望吧,能有更多不一样的声音,让观众得到更客观的信息,网络影评有更好的信誉。

  本版文/本报记者 张小妹 摄影/本报记者 郝羿

  《网络影评人七大公约》内容

  1.坚持说真话、讲道理,营造开展网络影评的良好氛围;

  2.坚持实事求是的批评,不庸俗吹捧,不阿谀奉承,不用简单的商业标准取代艺术标准;

  3.尊重每一位观众喜欢或讨厌电影的权利;

  4.尊重观众对电影多样化、差异化、个性化的需求;

  5.坚持以专业的精神、运用自己的专业知识、对电影作专业分析,以理服人,增加公信力;

  6.无论优劣,认真对待每一部电影,在没有看完全片的情况下,不正式发表影评;

  7.坚决反对网络语言暴力,不用侮辱性语言谩骂、攻击电影作品、创作者和与自己观点不同的人。

视频:《头号玩家》为什么能成为2018年为止,豆瓣评分最高的一部电影?

我要回帖

更多关于 豆瓣评分在哪里评 的文章

 

随机推荐