Face book的Py Torch已经发展成为世界上最受欢迎的深度学习框架之一,今天它得到了新的库和大的升级,包括稳定的C前端API支持和图书馆升级,比如与AmazonWeb服务合作开发的模型服务库TorchServe。
火炬服务库支持Python和火炬脚本模型;它提供了同时运行多个模型版本的能力,甚至可以在模型存档中回滚到以前的版本。 亚马逊的工程师在今天的一篇博客文章中说,超过80%的Py火炬云机学习项目发生在AWS上。
Py Torch1.5还包括TorchElastic,这是一个允许人工智能从业者根据需要或如果出现问题,增加或减少云培训资源的图书馆。
一个AWS集成与Kubernetes为火炬弹性,使容器编排和容错。 在AWS上为火炬弹性集成的Kubernetes意味着Kubernetes用户不再需要手动管理与模型培训相关的服务,以便使用火炬弹性。
火炬弹性是指用于大型,分布式机器学习项目。 Py Torch产品经理乔·斯皮萨克告诉Venture Beat TorchElastic在Face book上用于大规模的NLP和计算机视觉项目,目前建设到公有云环境中。
斯皮萨克说:“火炬弹性所做的是,它基本上允许你在许多节点上改变你的训练,而没有训练工作实际上失败;它只会优雅地继续下去,一旦这些节点恢复在线,它基本上可以重新启动训练,并开始计算这些节点上的变体。 “我们看到[弹性容错]作为再次与亚马逊合作的机会,我们也有一些来自微软的拉请求,我们已经合并了。 因此,我们基本上期望所有三个主要的云提供商都支持用户在其云上对Kubernetes进行弹性容错。