谷歌云今天宣布推出Kubeflow管道,以促进企业内部的合作,并进一步使人工智能的获取民主化。 Kubeflow管道是免费的,并且是开源的。
谷歌云产品管理高级总监RajenSheth表示,他同意估计,世界上只有几千名机器学习工程师能够从概念到生产进行深入学习,但有数百万数据科学家和数千万开发者。
Kubeflow Pipelines旨在解决这一差距,增强更多数据科学家和开发人员的能力,帮助企业克服成为人工智能第一公司的障碍。
“我们现在看到的最大的问题之一是公司正在努力建立数据科学家团队,但这是一种稀缺的资源,除非利用得很好,它就会开始浪费,”Sheth说。 “我们看到的一个观察是,在大约60%以上的案例中,模型从来没有被部署到生产中。 因此,我们正在做一些事情,希望能帮助治愈这种疾病。
管道是一个可组合的层,所以机器学习旅程的不同部分可以像乐高一样被抢购。
这种方法允许团队的不同成员做一些事情,比如标签数据、将数据转换为特征和验证数据。 它还可以用于测试几次迭代,并在找到更好的模型或方法时替换模型或方法。
他说:“他们可以在新的模型中交换,保持管道的其余部分到位,然后看到:‘这个新模型对输出有很大的帮助吗?’因此,它使…以更好的方式进行快速实验。 “我们正在使用管道,它可以开始让开发人员参与,它可以开始让业务分析师参与,它可以开始让最终用户参与,这样他们就可以成为可以构建管道的团队的一部分。
Kubeflow是谷歌今年早些时候发布的一个开源项目,用于使用Kubernetes容器进行机器学习。 使用Kubernetes将允许企业灵活,避免不得不完全致力于在云中使用现场数据和框架或培训模型来培训AI模型。
Kubeflow管道部分是基于并利用来自TensorFlow Extended(TFX)的库,该库在Google内部用于构建机器学习组件,然后允许不同内部团队的开发人员利用该工作并将其投入生产。
今天在alpha发布的还有AIHub,它建立在机器学习模块TensorFlowHub之上,今年早些时候发布。 人工智能集线器的设计是一个一站式商店,为有兴趣培训或部署人工智能模型的人。
除了提供培训外,AIHub还将填充来自谷歌的资源,例如流行的TensorFlow嵌入和来自Kaggle的内容,Kaggle是一个由200多万数据科学家组成的社区。
随着时间的推移,谷歌希望AIHub成为由更大的生态系统生成的流行模型的地方。
“我们最终希望AI集线器成为一个第三方也可以分享信息的地方,并随着时间的推移将其转变为一个市场,”Sheth说。 “我们发现,社区实际上可以解决我们许多客户的问题。
人工智能集线器最初将提供给大约100个商业伙伴。
像Kubeflow管道一样,AIHub也旨在教育员工消除公司内部团队之间的障碍,这样他们就可以使开发人员、数据科学家和ML工程师的工作更有价值。
人工智能素养是上个月在VB峰会上与Google和GoogleCloud等公司高管讨论的一个概念。
“我认为真正的大挑战是,要想成为人工智能第一,每个人都需要具备人工智能的知识,从产品经理思考问题到开发人员,到数据科学家,再到生产团队,都是如此。 一旦你有了这一点,你就可以开始将人工智能纳入几乎任何业务问题中,这就是我们现在的处境。
“几乎谷歌的每一款产品现在都在以有趣的方式使用人工智能,我们意识到它可以为我们解决越来越多的问题,我们希望这能帮助其他公司培养这种文化。