众包自动测试公司Applause今天宣布推出新的 人工智能培训解决方案,它将帮助机器学习算法更好地处理人工输入数据。
新的可扩展,可用于企业的解决方案可以训练机器学习算法快速学习并测试它们以检测和纠正偏差,从而确保它们能够正确处理和响应。
为此,掌声正在使用其庞大的经过审查的人类测试人员社区,以便在最能与被测试产品和服务的实际条件相匹配的环境中,提供最广泛的潜在培训输入。然后,这些数据将通过系统反馈并在所有可能的设备,位置和环境中进行测试,以帮助识别可能出现的问题并实时提供可操作的用户反馈。
用户希望AI更自然,更人性化。Applause的众包方法提供了AI所缺少的东西:在发布之前会有大量的真实人类交互,” Applause产品副总裁Kristin Simonini说。
通过设计,掌声收集的数据旨在避免出现孤立的小群体的偏见,这对任何人群来说都是很差的表现。对于才华横溢的测试人员而言,这尤其是个问题,他们的人群很容易引入偏见,因为培训测试产品的人可能很容易来自相同的背景。
因此,公司收集的机器学习培训数据来自多个国家,不同年龄,性别,种族,文化政治派别,意识形态,社会经济背景,教育水平等等的人们。与从较小的组中获取数据相比,这种广泛的数据样本基础可以更好地模拟偏差较小的输出。
西蒙尼尼说:“这不仅将改善各地消费者的AI体验,而且社区的广度还具有减轻偏见的潜力,并使AI更加代表现实世界。”
当前市场上的所有类型的AI都遇到了极为相似的问题:获取足够的数据来教授ML算法如何解释和响应。这项挑战阻碍了从旨在识别食物的营养应用程序到了解不同用户如何要求相同事物的虚拟助手的许多AI解决方案的生产。
掌声的新AI解决方案可在五种不同类型的AI互动中运行:语音,光学字符识别,图像识别,生物识别和聊天机器人。
对于语音,数据池使用源话语来训练启用语音的设备。对于OCR,它在视觉上包含阅读的文档和相应的文本以构建上下文。通过图像识别,它为机器学习算法提供了检测和分类预定义对象和位置的能力。对于生物识别,它获取诸如面部和指纹之类的生物识别输入。对于聊天机器人,数据源会采样问题和意图,以更好地了解用户需求并以更人性化的方式进行响应。
当训练AI系统的团队未能考虑到大量潜在的人工输入时,不仅可能导致不良的客户服务或产品,还可能导致更多的后果。一些极端的机器学习失败之所以成为新闻,是因为它们无法正确识别人脸,例如2015年Google LLC照片识别算法将黑人误认为是“大猩猩”(该公司已通过从其培训库存中移除大猩猩进行了纠正)。在2016年,新西兰护照核对算法误以为他是22岁的具有亚洲特色的DJ理查德·李(Richard Lee)闭着眼睛。
尽管这些失败已广为人知,并且事后看来潜在的问题似乎很明显,但它们也揭示了一个深层的文化问题,即如何培训AI系统以与不同人群互动。机器学习在与人互动时的扩散和实施是一个以人为本的问题,需要考虑到这一点的解决方案。
掌声希望利用其众包的人力数据池,帮助迈出建立更好的AI培训系统的第一步,该系统将减少未来发生这些错误的可能性,并有可能在偏见成为人类问题之前对其进行检测并发出警告。