Twitter可以用于花粉热监测吗?深度学习在相关知识提取中的应用

社交媒体平台主要用于网络,也是各种主题的宝贵知识来源,包括人口的健康.如果采用适当的技术,可以通过医疗专业人员和决策者有效利用这些知识,如果采用适当的技术来处理大量,高速度,高品质,并且通常是可争议的准确性用户生成的内容。在一个研究文章,本月出版于BMC医学信息学及决定,作者旨在调查推特数据用于花粉热监测的潜力,并验证其有效性相关的使用最先进的深度学习模型进行内容策划。

为什么社交媒体的健康监测?

众多研究已经证明Twitter用户可以与他们的在线网络公开分享健康相关信息(如症状、治疗)。流行性感冒)来自社交媒体的信息在文学中得到了广泛的调查,虽然过敏条件仍然很大程度上是未开发的. 同时2014-2015年,五分之一的澳大利亚人患有花粉热,成为最常见的慢性呼吸道疾病之一。由于环境变化和日益严重的污染,花粉过敏症危险地呈上升趋势,不仅在澳大利亚,而且在澳大利亚在全世界.

目前对花粉热估计的尝试包括官方统计数据或市场调查。最近,从GP处方、住院、花粉率和抗组胺药销售中获得的数据已被利用。现有方法既耗时又成本高,并且仅提供了有关花粉热的高水平详细信息社交媒体(通常是对预先指定的问题的回答)。鉴于这些局限性,社交媒体已经成为一种有吸引力的选择,因为实时数据是以一种不引人注目的方式自动提取的。

与用户生成的内容相关的挑战

尽管社交媒体平台上提供了丰富的知识,但用户生成内容的原始形式在社交媒体中极具挑战性相关的内容提取(即实际的花粉热自我报告)由于大量广告、新闻、警告等(尽管仍与花粉热有关)。此外,用户写的帖子经常在语法错误,模棱两可的短语,创意表达式中取比.例如,如何自动识别该推文“我没有哭,是我的花粉热在加剧”是指最常见的花粉热症状(流泪)?或者如何训练系统认识到这一点t是流行花粉热药物的商业名称,但没有广泛的药物列表全部先验提供的潜在药物有哪些?

深度学习是挑战性内容策划的有希望的解决方案

机器学习的最新进展,特别是其子字段称为深度学习,在高度挑战的用户生成的内容策策中表现出很大的承诺。提供甚至相对较小的类阳性和类负例示例(以自然语言)提供系统,并让模型识别两个类之间最独特的功能,已经证明是成功的医疗保健领域超过.

此外,自然语言处理领域的最新技术——将单词嵌入到模型训练中,进一步提高了该方法的准确性和鲁棒性。也就是说,词到向量表示(词嵌入)允许解释词之间的句法和语义联系(相像的单词出现在相像的背景)。这是由于预计矢量空间中附近与概念相关的术语的位置(例如,蜜蜂蜂蜜更接近花粉孢子化石).因此,泪水可以链接到水汪汪的眼睛, 和嗤之以鼻流鼻涕没有明确的规则定义。

澳大利亚Twitter的Hay发烧监测案例研究

这项在澳大利亚进行的研究旨在调查推特数据用于花粉热监测的潜力,并验证其有效性相关的使用最先进的深度学习模型(仍在健康信息域中的婴儿期)内容策策。在6个月的时间内提取主要数据,覆盖高花粉季节。随着预期的,Twitter用户的数量hay发烧自我报告从10月和11月达到了预期的。对于最高表现模型(GU)和预训练的单词嵌入(手套),相关帖子检测的准确性高达88%高达88%。无需预先义规则规范,我们工作的主要贡献包括自动检测的隐含症状和新兴处理。结果证明,来自诸如社交媒体来源的替代来源的实时健康监测,并作为目前有限的花粉过敏患病率和严重程度估算的方法是有吸引力的补充。

查看BMC系列博客主页上的最新帖子188宝金博备用网址

注释