X射线视觉长期以来似乎是一个牵强附会的科幻幻想,但在过去十年中,由麻省理工学院计算机科学与人工智能实验室(CSAIL)的Dina Katabi教授领导的团队不断让我们更接近透过墙壁看到。
他们的最新项目“RF-Pose”使用人工智能(AI)来教授无线设备,以感知人们的姿势和动作,甚至是从墙的另一侧。
研究人员使用神经网络分析从人体反弹的无线电信号,然后可以创建一个动态的棒状图形,当人们执行这些动作时,它会走动,停止,坐下并移动四肢。
该团队表示,该系统可用于监测帕金森氏症和多发性硬化症(MS)等疾病,更好地了解疾病进展,并允许医生相应地调整药物。它还可以帮助老年人更加独立地生活,同时为跌倒,受伤和活动模式的变化提供额外的安全监控。
(团队收集的所有数据都经过主体同意,并且是匿名和加密的,以保护用户隐私。对于未来的实际应用程序,团队计划实施“同意机制”,其中安装设备的人员需要进行操作特定的一组动作,以便它开始监测环境。)
该团队目前正在与医生合作,探索医疗保健领域的多种应用。
“我们已经看到,监测患者的步行速度和自己做基本活动的能力,为医疗服务提供者提供了他们以前从未有过的生活窗口,这对于各种疾病都是有意义的,”Katabi说。 ,谁共同撰写了一篇关于该项目的新论文。“我们的方法的一个关键优势是患者不必佩戴传感器或记得给他们的设备充电。”
除了医疗保健外,该团队表示,RF-Pose还可用于新型视频游戏,玩家可以在家中移动,甚至可以在搜索和救援任务中帮助找到幸存者。
“就像手机和Wi-Fi路由器已成为当今家庭必不可少的部分一样,我相信像这样的无线技术将有助于为未来的家庭提供动力,”Katabi说道,他与博士生和领导共同撰写了新论文。作者:Mingmin Zhao,麻省理工学院教授Antonio Torralba,博士后Mohammad Abu Alsheikh,研究生Tianhong Li和博士生Yonglong Tian和Hang Zhao。他们将于本月晚些时候在犹他州盐湖城举行的计算机视觉与模式识别会议(CVPR)上发表演讲。
研究人员必须解决的一个挑战是,大多数神经网络都是使用手工标记的数据进行训练的。例如,训练用于识别猫的神经网络要求人们查看图像的大数据集并将每个图像标记为“猫”或“非猫”。同时,无线电信号不容易被人类标记。
为了解决这个问题,研究人员使用他们的无线设备和相机收集了一些例子。他们收集了成千上万的人们做的事情,比如走路,说话,坐着,打开门,等待电梯。
然后,他们使用来自相机的这些图像来提取棒图,它们与相应的无线电信号一起显示给神经网络。这种示例组合使得系统能够学习无线电信号与场景中人物的简笔画之间的关联。
在训练后,RF-Pose能够仅使用从人体反弹的无线反射来估计一个人没有摄像头的姿势和动作。
由于摄像机无法通过墙壁看到,因此网络从未明确地对墙壁另一侧的数据进行过培训 - 这使得麻省理工学院团队特别惊讶于网络可以将其知识概括为能够通过墙运动。
“如果你把计算机视觉系统看作是老师,这是一个非常有趣的例子,表明学生的表现优于老师,”托拉尔巴说。
除了感知运动外,作者还表明,他们可以使用无线信号在一百个人的阵容中准确识别出83%的时间。这种能力对于搜索和救援行动的应用特别有用,因为它可能有助于了解特定人员的身份。
对于本文,该模型输出了二维棒图,但该团队还致力于创建能够反映更小微动的三维表示。例如,它可能能够看到老年人的手是否经常摇晃以至于他们可能想要进行检查。
“通过使用视觉数据和人工智能的这种组合来透视墙壁,我们可以实现更好的场景理解和更智能的环境,让他们过上更安全,更富有成效的生活,”赵说。