Kubeflow的第一个稳定版本(由Google LLC支持的工具包,用于在Kubernetes上运行人工智能工作负载)今天正式可用。
Kubeflow由一组Google工程师和其他科技公司的一些同行开源。它是一个工具套件,使组织能够在由流行的容器编排框架Kubernetes支持的基础架构上部署AI工作负载。
Kubeflow 1.0版本引入了该软件几个核心组件的整数版本。这些组件现在符合企业用户需求的“定义的稳定性,可支持性和可升级性级别”,这意味着该工具包现在更适合生产使用。
Kubeflow 1.0带来了稳定的内置管理控制台版本,其中包含关键功能的快捷方式。这些功能之一是Jupyter Notebook控制器,该控制器也已升级到稳定状态,并允许AI团队使用无处不在的Jupyter Notebook开发工具创建新的机器学习模型。
模型准备好后,用户可以使用TensorFlow或PyTorch对其进行训练。Kubeflow 1.0通过TFJob和PyTorch Operator两者都支持,这两个代码抽象使开发人员可以使用他们选择的框架和相对简单的脚本来设置AI培训工作流。
今天的发行版还为管理员提供了一些功能,这些管理员可以管理开发人员在其上构建AI工作负载的基础架构。有一个kfctl,它可以在云环境中自动部署Kubeflow,并具有可以在各个开发人员之间分配环境资源的控件。
Google开源策略师Thea Lamkin在博客文章中详细介绍了“使用Kubeflow,可以为每个数据科学家或团队分配各自的命名空间,以在其中运行工作负载。” 命名空间提供了安全性和资源隔离。使用Kubernetes资源配额,平台管理员可以轻松限制个人或团队可以消耗多少资源,以确保公平的调度。”
在另一篇文章中,Google云工程师Jeremy Lewi和Abhishek Gupta写道,公司可以在其Anthos应用程序平台上部署Kubeflow 1.0,以利用这些新功能。展望未来,这家搜索巨头计划加强对AI工具包的支持。谷歌将允许企业在本地Anthos部署上设置Kubeflow,并将与Google Cloud的网络安全功能添加更紧密的集成。