Google试图在机器学习社区中促进更多的协作,该社区专注于人工智能的特定子集,该子集试图模仿人脑的学习方式。
为此,它将BigQuery云数据仓库和分析服务与Kaggle集成在一起, Kaggle是一个供数据科学家和其他机器学习爱好者使用的在线社区,以探索,分析和共享他们的工作。该公司表示,通过将BigQuery和Google于两年前收购的Kaggle结合,该公司可以在“直观的开发环境”中查询数据,而无需先移动或下载该信息。
用户将能够执行SQL查询,使用结构化查询语言训练机器学习模型并在Kernels(Kaggle的免费托管Jupyter笔记本环境)中分析这些模型。Jupyter笔记本是Web应用程序,可使数据科学家更轻松地共享和协作软件代码。
为了利用这一优势,数据科学家将需要创建一个Google Cloud帐户并将其链接到其Kernels笔记本或脚本。完成后,他们可以使用BigQuery应用程序编程接口库直接在笔记本中查询数据并对其进行分析。
“例如,您可以导入最新的数据科学库,例如Matplotlib,scikit-learn和XGBoost,以可视化结果或训练最先进的机器学习模型,” Kaggle产品经理Jessica Li和BigQuery主任Jordan Tigani写道。博客文章。“更好的是,利用Kernel的大量免费计算功能,其中包括GPU,高达16GB的RAM和9个小时的执行时间。”
谷歌表示,在Kaggle中查询和分析数据是一个更加无缝的过程,因为它意味着无需像以前那样先在查询编辑器中查询数据,然后再将该数据导出到其他地方即可完成分析。
Li和Tigani写道:“此外,Kaggle是一个共享平台,可让您轻松地公开内核。” “ Kaggle使您可以传播开源工作,还可以与世界一流的数据科学家专业人员讨论数据科学。”
从今天开始,BigQuery和Kaggle集成将可用。