当研究人员试图解决其中许多问题时,其中许多问题都不会简单回答“是或否”,因此人们也在试图弄清楚如何保护自己和家人的安全。但是,在24小时新闻周期,数百篇预印本研究文章以及地区,州和联邦政府之间变化的指南之间,人们如何最好地浏览如此大量的信息?
利用自然语言处理和人工智能领域的见解,计算机科学家Dan Roth和认知计算小组正在开发一个在线平台,以帮助用户找到有关新型的相关且可信赖的信息。作为他的小组为开发用于导航“信息污染”的工具而做出的广泛努力的一部分,该平台致力于识别单个查询可能具有的多种视角,显示支持每种视角和组织结果的证据,以及每种来源的证据。 “可信赖性”,以便用户可以更好地了解已知信息,由谁以及为什么。
由于人类语言和交流的复杂性,创建这些类型的自动化平台对自然语言处理和机器学习领域的研究人员构成了巨大挑战。罗斯说:“语言是模棱两可的。每个词,取决于上下文,可能意味着完全不同的东西。” “而且语言是可变的。您想要说的一切,都可以用不同的方式说。要使这一过程自动化,我们必须解决这两个关键难题,而这正是挑战所在。”
由于在概念和理论上取得了许多进步,认知计算小组在自然语言理解方面的基础研究使他们能够运用他们的研究见解,并开发出可以更好地理解人类语言内容的自动化系统,例如在语言中所写的内容。新闻文章或科学论文。罗斯和他的团队多年来一直致力于解决与信息污染有关的问题,现在正将他们学到的知识应用到有关新型的信息中。
信息污染有多种形式,包括偏见,错误信息和虚假信息,并且由于信息量巨大,从小说中对事实进行分类的过程需要自动化的支持。罗斯说:“发布信息非常容易,”他补充说,虽然像宾夕法尼亚州安嫩伯格公共政策中心的项目FactCheck.org这样的组织会手动验证许多索偿的有效性,但没有足够的人力来核实每条已公布的索偿在网上。
博士说,仅事实检查还不足以解决所有信息污染问题。学生四好陈。他问人们是否应该戴口罩的问题:“在过去的几个月中,这个问题的答案已经发生了巨大变化,而这种变化的原因是多方面的,”他说。“您找不到与该特定问题相关的客观事实,并且该问题的答案取决于上下文。仅凭事实检查无法解决此问题,因为没有单一答案。” 这就是为什么团队说,确定各种观点以及支持它们的证据很重要的原因。
为了帮助解决这两个障碍,搜索平台将结果可视化,包括来源的可信度,同时突出显示不同的观点。这与在线搜索引擎显示信息的方式不同,在在线搜索引擎中,搜索结果的主要依据是受欢迎程度和关键字匹配,而很难看到文章中的论点如何相互比较。但是,在此平台上,不是根据单个文章来显示文章,而是根据它们提出的声明进行组织。