卡内基梅隆大学和耶路撒冷希伯来大学的研究人员设计了一种方法,使计算机能够挖掘专利,发明和研究论文的数据库,找出可以用来解决新问题或创造新产品的想法。
具体来说,他们为计算机开发了一种方法来找到类比 - 有时候不同的方法和强调潜在相似性的问题之间的比较。
任何喜欢看电视的人都喜欢用电脑夹解除导弹,或用巧克力棒敲打硫酸泄漏的人可以告诉你,类比可以为解决问题提供重要的见解和灵感。利用庞大的发明数据库可以刺激创新,但是在没有类比帮助的情况下这样做就像在大海捞针一样。
卡内基梅隆大学和希伯来大学的计算机科学家通过结合众包和一种称为深度学习的人工智能解决了类比问题。通过观察人们如何发现类比,他们获得了他们用来训练计算机软件以找到更多类比的见解。
CMU人机交互研究所副教授Aniket Kittur表示,“经过数十年的努力,这是第一次有人在计算机上大规模地获得类比问题。”
“一旦你可以搜索类比,你就可以真正提高创新速度,”希伯来大学CMU校友和计算机科学家Dafna Shahaf说。“如果你能加快创新速度,就可以解决下游的许多其他问题。”
研究小组将于8月17日星期四在新斯科舍省哈利法克斯举行的知识发现和数据挖掘会议2017年KDD上展示其研究结果,该研究论文已经获得了最佳论文奖和最佳学生论文奖。
类比在任何数量的发现中都发挥了作用。意大利微生物学家萨尔瓦多·卢里亚(Salvador Luria)在观看老虎机的同时,构思了一项关于细菌突变的实验 - 后来为他赢得了诺贝尔奖。莱特兄弟使用了有关平衡和重量的见解,同时建造自行车以帮助他们实现动力飞行。从葡萄酒瓶中取出松散的软木塞的一个技巧激发了阿根廷汽车修理工发明一种装置来缓解分娩困难。
找到类比并不总是那么容易,特别是对于计算机来说,它们不像人类那样在深层语义层面上理解事物。研究人员尝试手工制作数据结构,但这种方法耗时且昂贵 - 对于可包含900万美国专利或7000万份科研论文的数据库而言,这种方法无法扩展。其他人尝试从大量文本中推断出这种结构,但这种方法主要表现出表面相似性,而不是对解决问题有用的深刻理解。为了寻求一种新的方法,Kittur花了数年时间研究众包作为寻找类比的手段,他与Shahaf合作,Shahaf专注于计算类比。
与Shahaf的博士一起学生汤姆霍普和CMU博士后研究员乔尔陈,他们设计了一个计划,通过亚马逊机械土耳其人雇用的人群工人在Quirky.com产品创新网站上寻找类似的产品。根据产品描述,他们寻找具有类似目的或采用类似机制的产品。
“我们能够看到这些人的大脑,因为我们强迫他们展示他们的工作,”Chan解释道。例如,对酸奶制造商的描述可能会产生与其目的相关的词语,例如“浓缩”,“食物”和“减少”,以及诸如“液体”,“泵”和“加热”等词语。它的机制。“就类比而言,这不是关于酸奶,而是关注集中精力,”他指出。
基于这些见解,计算机可以学习分析其他产品描述并确定自己的类比,其中许多反映了看似不同的产品之间的相似性,而不仅仅是表面相似性。希望说,当群众工作者随后使用类比来推荐新产品时,这些“遥远”的类比产生了最具创新性的想法。
可以使用相同的方法来定制计算机程序以在专利申请或科学研究论文中找到类比。
美国国家科学基金会支持这项研究,博世,谷歌和CMU的Web 2020倡议也是如此。
计算机科学学院的CMU AI计划通过利用学校在计算机视觉,机器学习,机器人技术,自然语言处理和人机交互方面的优势,推进人工智能研究和教育。