人工智能(AI)具有提高医疗诊断速度和准确性的真正潜力。但是,在临床医生利用人工智能的力量来识别X射线等图像中的条件之前,他们必须“教”算法寻找什么。
识别医学图像中的罕见病症已经给研究人员带来了持久的挑战,因为可以用于在监督学习环境中训练AI系统的图像稀缺。
Shahrokh Valaee教授和他的团队设计了一种新方法:利用机器学习创建计算机生成的X射线来增强AI训练集。
“从某种意义上说,我们正在利用机器学习来进行机器学习,”多伦多大学电子与计算机工程系(ECE)Edward S. Rogers高级教授Valaee说。“我们正在创建反映某些罕见情况的模拟X射线,以便我们可以将它们与真实的X射线结合起来,以便拥有足够大的数据库来训练神经网络,以识别其他X射线中的这些条件。”
Valaee是医学实验室机器智能实验室(MIMLab)的成员,该实验室是一组医生,科学家和工程研究人员,他们将图像处理,人工智能和医学方面的专业知识结合起来,以解决医疗挑战。“人工智能有可能在医学领域以各种方式提供帮助,”Valaee说。“但要做到这一点,我们需要大量数据 - 我们需要使数千个标记图像才能使这些系统在某些罕见情况下不存在。”
为了创建这些人造X射线,该团队使用称为深度卷积生成对抗网络(DCGAN)的AI技术来生成并持续改进模拟图像。GAN是一种由两个网络组成的算法:一个生成图像,另一个尝试区分合成图像和真实图像。训练两个网络使得鉴别器不能将真实图像与合成图像区分开。一旦产生足够数量的人造X射线,就将它们与真实的X射线组合以训练深度卷积神经网络,然后将其分类为正常或识别许多条件。
“我们已经能够证明由深度卷积GAN生成的人工数据可用于增强真实数据集,”Valaee说。“这为培训提供了更多的数据,并提高了这些系统在识别罕见情况方面的表现。”
MIMLab通过其AI系统对其增强数据集与原始数据集的准确性进行了比较,发现普通条件下的分类准确度提高了20%。对于一些罕见的情况,准确度提高了大约40% - 并且因为合成的X射线不是来自真实的个体,所以数据集可以容易地被医院外的研究人员使用而不会侵犯隐私问题。
“这令人兴奋,因为我们已经能够通过证明这些增强数据集有助于提高分类准确性来克服将人工智能应用于医学的障碍,”Valaee说。“深度学习只有在训练数据量足够大时才有效,这是确保我们拥有能够高精度地对图像进行分类的神经网络的一种方法。”