仇恨在空中!但是哪里?引入一种算法来检测数字微环境中的仇恨言论

犯罪科学一直表明,犯罪不是在时空中随机分布的。但是,如何在社交媒体上检测犯罪意图和仇恨言论,而“地方”不是身体上的?在一个新文章出版于犯罪科学,研究人员定义了什么是数字微环境,并引入了一种新算法来检测仅以元数据为基础的仇恨言论,这与基于语义和句法方法的传统设计不同。

为了了解哪些因素在特定时间在特定的地方聚集在特定的地方,环境犯罪学家将其分析的重点从犯罪或遭受犯罪遭受犯罪的个人转移到了发生的环境中。他们的起步前提是,每个环境的特征都有利于或阻碍犯罪,并且可以干预这些环境以控制它。

仇恨言论是一种低众的现象,很难在所有噪音中检测到。定义很复杂,它是一种非常自适应的现象

最近已经开发了网络犯罪和地点理论框架,以推断对网络空间的犯罪场所的分析。当然,谈论网络空间中的位置似乎是违反直觉的,但是环境犯罪学给出的概念的含义超出了物理空间。这些网络场所的目的是,它们允许人和事物的融合。而且,在没有监护人的情况下,这种融合会产生犯罪的机会。

(Shamia Casiano摄于Pexels)

Twitter和仇恨言论

在Twitter上,用户不断地与其他用户在微观层次,数字微环境中发布的信息互动,这些信息是由人(即帐户)组合定义的,他们对其他人(即推文)(即推文)(即其他人)(即其他人)(即其他人)(即其他人)(即其他人)(即其他人)(即帐户)。在大多数情况下,这是一项无害的活动,但是这些推文中的一条可能包含一种称为仇恨言论的激进内容。

每天在Twitter上发布了数亿条推文。警察和服务提供商每天都在寻找Twitter仇恨言论以消除它。但是,仇恨言论是一种低尚的现象,很难在所有噪音中检测到。认为他们可以控制Twitter上发布的所有内容是不现实的。然而,用户期望他们这样做

我们已经开发了一个机器学习模型,该模型以每条推文的元数据为食,以确定其是否包含92%精度的仇恨言论。

仇恨言论检测提出了两个主要挑战。首先,定义并因此定义是复杂的。其次,语言的活力将其转化为一种非常适应性的现象。传统上,语义方法已被用于检测。如果这些方法包含先前被归类为激进的某些单词,则将其视为仇恨言论。但是根据上下文的不同,某些单词可能是误导性的,并导致不正确的分类。

我们已经使用了另一种方法来克服这些方法的局限性。在我们的论文中,我们假设数字微环境的特征条件仇恨言论模式。基于这个想法,我们开发了一种机器学习模型,该模型以每条推文的元数据为食,以确定其是否包含92%精度的仇恨言论。通过使用通过Twitter发送的推文样本之后2017年6月伦敦桥梁恐怖袭击((n = 200,880), the present study introduces a new algorithm designed to detect hate speech messages in cyberspace.

通过应用机器学习分类技术随机森林,我们的分析表明,与推文相互作用和结构相关的元数据与识别其所包含的内容特别相关。因此,我们期望促进和减少警察和服务提供商执行的分析任务,以减轻仇恨言论对社交网络用户的影响。

查看有关社会主页的最新帖子金博宝188app网站

评论