爱国者四分卫汤姆布拉迪经常将他的成功归功于花费无数个小时研究对手的电影动作。这种对运动的理解对于所有生物来说都是必要的,无论是弄清楚投球的角度,还是感知掠食者和猎物的运动。但简单的视频实际上无法给我们全面的了解。
这是因为用于研究运动的传统视频和照片是二维的,并没有向我们展示人或感兴趣的主题的潜在三维结构。没有完整的几何形状,我们无法检查有助于我们更快地移动的小而微妙的动作,或者理解完善我们的运动形式所需的精确度。
最近,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员提出了一种方法,可以更好地理解对复杂运动的理解。
新系统使用的算法可以拍摄二维视频并将其转换为三维打印的“运动雕塑”,展示人体如何在空间中移动。除了作为形状和时间的迷人美学可视化之外,该团队还设想他们的“MoSculp”系统可以为专业运动员,舞者或任何想要提高身体技能的人提供更详细的运动研究。
“想象一下,你有一个关于罗杰·费德勒在网球比赛中投球的视频,以及一个自己学习网球的视频,”博士学生张秀明说,他是一篇关于该系统的新论文的第一作者。“然后你可以建立两种场景的动作雕塑来比较它们,并更全面地研究你需要改进的地方。”
因为运动雕塑是三维的,所以用户可以使用计算机界面在结构周围导航并从不同的视点看到它们,从而揭示从原始视点无法访问的与运动相关的信息。
张与麻省理工学院教授William Freeman和Stefanie Mueller,博士生Jijun Wu,Google研究员Qiurui He和Tali Dekel以及加州大学伯克利分校博士和前CSAIL博士Andrew Owens共同撰写了这篇论文。
这个怎么运作
长期以来,艺术家和科学家一直在努力获得更好的运动洞察力,受到他们自己的相机镜头及其可提供的内容的限制。
以前的工作大多使用所谓的“频闪”摄影技术,这看起来很像拼接在一起的翻书中的图像。但是,由于这些照片只显示了运动的快照,例如,当他们击打高尔夫球时,你将无法看到一个人手臂的轨迹。
更重要的是,这些照片还需要费力的预拍设置,例如使用干净的背景和专业的深度照相机和照明设备。所有MoSculp需求都是视频序列。
给定输入视频,系统首先自动检测对象身体上的2-D关键点,例如芭蕾舞女演员的髋关节,膝关节和踝关节,同时进行复杂的舞蹈序列。然后,它将这些点中最好的姿势变成3-D“骨架”。
将这些骨架拼接在一起后,系统会生成一个可以3D打印的动作雕塑,显示主体追踪的平滑,连续的运动路径。用户可以自定义他们的数字,专注于不同的身体部位,分配不同的材料来区分不同的部分,甚至自定义照明。
在用户研究中,研究人员发现超过75%的受试者认为MoSculp提供了比标准摄影技术更详细的运动学习可视化。
Adobe的传播负责人Courtney Brigham说:“舞蹈和高技能的运动动作通常看起来像'移动雕塑',但它们只会形成稍纵即逝的短暂形状。”“这项工作展示了如何采取动作并将其转化为具有客观运动可视化的真实雕塑,为运动员提供了一种分析他们的训练动作的方式,不需要设备而不是移动摄像机和一些计算时间。”
该系统最适合较大的动作,例如在舞蹈序列中投球或进行一次飞跃。它也适用于可能阻碍或复杂运动的情况,例如穿着宽松衣服或携带物品的人。
目前,该系统仅使用单人场景,但团队很快希望扩展到多人。这可以开辟研究社会障碍,人际交往和团队动力等方面的潜力。
该团队将在下个月在德国柏林举行的用户界面软件和技术(UIST)会议上向系统展示他们的论文。