电影角色的关系揭示了性别的哪些方面?随着时间的推移,这又是如何变化的?

虽然有增量进展,电影中的性别差距仍然很宽。利用来自IMDB的文件和信息超过15,000部电影,我们发现,在流派中的电影中最多的10个中央角色中,平均只有3.3名女性。

数据科学有可能为广泛的社会科学问题做出贡献。在这里,我们对电影中的女性的描写,这是一个对社会影响有重大影响的行业影响,包括自尊和职业选择。金博宝188app网站

在过去几年中,电影业的性别差距引起了很多关注。这个问题是众所周知的:妇女仍然是低估和不足的。这种情况必须改变,我们认为改变某事的最佳方式是通过在问题所在的地方脱落。

数据科学如何提供帮助?

作为数据科学家,我们决定利用网络和机器学习算法来通过表现最大的分析来调查电影行业中的性别差距问题。

为此,我们将来自在线电影数据库IMDb的数据和一个来自封闭字幕字幕的电影对话数据集融合在一起,创建了最大的电影社交网络语库(15540个网络)。

分析这一点,我们调查了银幕上的女性在过去一个世纪的电影行业的角色。首先,将电影字幕数据与IMDb数据集结合。接下来,使用命名实体识别(NER),我们从字幕中提取电影角色,并将它们与演员连接起来。然后,我们建立了一个电影角色之间互动的社交网络。

如何通过字幕构建社交网络

为了更好地理解我们的算法是如何工作的,让我们以“the Matrix”字幕中的三行为例。首先,我们使用NER来检测每个角色的名字何时何地出现在字幕中。在这种情况下,我们有一个场景是摩尔甫斯和尼奥对话。为了找到指定的演员并验证它是否是一个字符,我们将字幕中找到的名字与IMDb中的字符列表进行匹配。

最后,使用匹配的字符,我们在电影中以小于预定义阈值的时间间隔创建了一个字符之间的链接。在我们的示例中,我们知道Morpheus介绍了Neo,我们知道Morpheus和Neo在5秒的间隔内谈话。

如果5秒小于预定义的阈值,我们就连接并边缘Neo和Morpheus。我们对电影字幕中的所有台词都这样做,结果就形成了一个加权的社会网络,其中边的权值是两个节点(角色)同时出现的次数。

《星球大战》系列电影中女性形象的演变(版权所有:迪玛·卡根、托马斯·切斯尼和迈克尔·费雷CC BY 4.0)。

看着中心

利用这些网络,我们调查了电影中的性别差异。我们认为,根据女性在网络中的中心地位来分析排名前10位的女性数量会很有趣。

尽管上个世纪的改善,但平均而言,仍有两倍的男性在电影中领先的妇女。

主要角色是电影中最重要的角色,它获得了大部分的聚光灯,这是重要的是看到足够多的女性在这些角色。我们发现,平均而言,女性在电影中扮演的核心角色较少,差距非常明显。

在上个世纪,这个数字一直在不断增长;然而,今天平均而言,在电影中排名前10个角色的女性仍有两倍的男性。这个结果表明,在普通女性上有更小的角色。

如何衡量公平的代表?

今天,最著名的衡量女性在电影中表现的平等程度的标准是Bechdel测试。要通过这一测试,这部电影必须通过三个标准:(1)它必须有至少两个女人在里面,(2)她们互相交谈,(3)关于男人以外的事情。

这是我们思想的第一件事,手动检查每部电影并不容易查看它是否通过测试,为什么不自动化它。我们使用我们构建的网络来提取基于网络的功能,我们创建了一种基于机器学习算法的自动化Bechdel测试。

使用我们的自动贝克德尔测试,我们发现一些电影目前是错误分类的,根据他们的贝克德尔测试分数。此外,我们使用它来量化未分类的电影,发现通过Bechdel测试的电影数量有所增加。

玛丽莲·梦露是一位美国女演员,因出演喜剧《金发性感尤物》而闻名。图像由skeeze, Pixabay CC-0。

虽然Bechdel测试肯定是一个有用和重要的测试,但它无法解释许多参数,例如人物的中心,镇压等基本上,如果有一部只有两个妇女出现在一个场景并谈论的女性除了男人以外的东西几秒钟,那么电影将通过传统的Bechdel测试。

我们强烈认为,今天我们应该有一个测试在电影中提供更准确的措施女性代表。我们提出了一个测试,使用每个性别的总程度(相互作用)来测量性别差距。

我们相信一个好的拇指应该是:

可悲的是,只有12%的电影通过此测试。据说,我们发现了很多证据表明在电影中妇女代表性的提高趋势。

这些结果强调了与高级算法的大量数据的使用具有很高的潜力,以提高性别不平等研究。使用类似方法的未来研究还可以分析电视剧和其他类型的媒体露出额外的间隙。

查看关于社会主页的最新帖子金博宝188app网站

评论