天体物理学家第一次使用人工智能技术生成复杂的宇宙三维模拟。结果是如此快速,准确和强大,甚至创作者也不确定它是如何工作的。
“我们可以在几毫秒内完成这些模拟,而其他'快速'模拟需要几分钟时间,”研究报告的共同作者,纽约市熨斗研究所计算天体物理中心的小组负责人Shirley Ho说道。卡内基梅隆大学教授。“不仅如此,我们还要准确得多。”
该项目的速度和准确性,称为深度密度位移模型,简称D3M,并不是研究人员最大的惊喜。真正令人震惊的是,D3M可以准确地模拟宇宙在调整某些参数时的外观 - 例如宇宙中有多少是暗物质 - 即使模型从未接收到任何训练数据,这些参数也会变化。
“这就像教授图像识别软件一样,有很多猫和狗的图片,但它能够识别大象,”何解释说。“没有人知道它是如何做到的,这是一个很难解决的问题。”
何和她的同事们目前d3中号6月24日在国家科学学院院刊。该研究由Flatiron Institute研究分析师Siyu He领导。
Ho和他与加州大学伯克利分校伯克利宇宙物理中心的Yin Li和东京附近的Kavli宇宙物理和数学研究所合作;伯克利宇宙物理中心的余峰;熨斗研究所的魏晨;温哥华不列颠哥伦比亚大学的Siamak Ravanbakhsh;和Carnegie Mellon大学的BarnabásPóczos。
像D3M那样的计算机模拟已成为理论天体物理学的必要条件。科学家们想知道宇宙在各种情况下是如何演化的,例如,拉动宇宙的黑暗能量随着时间而变化。这些研究需要进行数千次模拟,使得闪电般快速且高度精确的计算机模型成为现代天体物理学的主要目标之一。
D3M模拟重力如何塑造宇宙。研究人员选择仅关注重力,因为它是迄今为止宇宙大规模演化中最重要的力量。
最精确的宇宙模拟计算重力如何在整个宇宙时代移动数十亿个单个粒子。这种精确度需要时间,一次模拟需要大约300个计算小时。更快的方法可以在大约两分钟内完成相同的模拟,但是所需的快捷方式会导致精度降低。
Ho,他和他们的同事通过从可用的最高精度模型中提供了8,000种不同的模拟,为D3M提供了深度神经网络。神经网络获取训练数据并对信息进行计算;然后研究人员将结果与预期结果进行比较。通过进一步培训,神经网络随着时间的推移适应,以产生更快,更准确的结果
在训练D3M之后,研究人员对6亿光年以上的箱形宇宙进行了模拟,并将结果与慢速和快速模型的结果进行了比较。虽然缓慢但准确的方法每次模拟需要数百小时的计算时间,而现有的快速方法需要几分钟,但D3M可以在30毫秒内完成模拟。
D3M也产生了准确的结果。与高精度模型相比,D3M的相对误差为2.8%。使用相同的比较,现有的快速模型的相对误差为9.3%。
Ho表示,D3M处理训练数据中未发现的参数变化的能力非常出色,这使得它成为一种特别有用和灵活的工具。除了建模其他力量,如流体动力学,Ho的团队希望更多地了解该模型如何在引擎盖下工作。何说,这样做可以为推动人工智能和机器学习带来好处。
“对于机器学习者来说,我们可以成为一个有趣的游乐场,以了解为什么这个模型推断得如此之好,为什么它会推断出大象而不仅仅是识别猫和狗,”她说。“这是科学与深度学习之间的双向道路。”