深度学习网络如何成为AI的重大突破

在我们迈入数学和数字世界的第一步时,我们发现一个苹果加另一个苹果等于两个苹果。我们学会计算真实事物。直到后来,我们才提出一个奇怪的概念:零…或一个空盒子里的苹果数量。

在阿拉伯学者和数学家斐波那契之后,“零”的概念彻底改变了数学,将其引入了我们的现代编号系统。今天,尽管我们舒适地在所有数学运算中使用零,但“什么都没有”的概念尚未进入人工智能领域。

从某种意义上说,人工智能和深度学习仍然需要学习如何无所不能地识别和推理。

是苹果还是香蕉?都不行!

传统上,深度学习算法(例如深度神经网络(DNN))以有监督的方式进行训练,以识别特定类别的事物。

在一个典型的任务中,可能会训练DNN以可视方式识别一定数量的类,例如苹果和香蕉的图片。深度学习算法在获得大量数据和质量的数据时,实际上非常擅长提供精确,低错误和可信的分类。

当第三个未知对象出现在DNN的前面时,就会出现问题。如果引入了训练集中不存在的未知对象(例如橙色),则网络将被迫“猜测”并将橙色分类为捕获未知对象的最接近类别-一个苹果!

基本上,用苹果和香蕉训练的DNN的世界完全由苹果和香蕉组成。它无法设想整个水果篮。

进入虚无世界

尽管在所有应用程序中它的用途还不是很清楚,但是在训练和部署DNN时,“无”或“零级”的想法在许多方面都非常有用。

在训练过程中,如果DNN能够将项目分类为“苹果”,“香蕉”或“什么都没有”,则算法的开发人员可以确定它是否尚未有效学习识别特定的类别。就是说,如果水果图片继续没有反应,那么开发人员可能需要添加另一类“水果”来识别,例如橘子。

同时,在部署方案中,经过培训以识别健康苹果和香蕉的DNN如果与已学会识别的原型水果有偏差,则不会回答“没有”。从这个意义上讲,DNN可以充当异常检测网络-除了对苹果和香蕉进行分类之外,它还可以不经进一步更改就发出信号,告知它看到偏离规范的东西。

到目前为止,还没有简单的方法来训练标准DNN,使其可以提供上面的功能。

一种称为终身DNN的新方法自然会将“无”概念纳入其架构。终生的DNN通过巧妙地利用反馈机制来确定输入是过去的匹配还是与其的不匹配,来做到这一点。

这种机制类似于人类的学习方式:我们在潜意识中不断检查我们的预测是否符合我们的世界。例如,如果有人在欺骗您并改变办公椅的高度,您会立即注意到它。这是因为您有了随着时间的推移而学习的办公椅高度的“模型”,如果该模型不成立,您将立即意识到异常。我们人类不断检查我们的分类是否符合实际情况。如果没有,我们的大脑就会注意到并发出警报。对我们而言,不仅有苹果和香蕉,还有苹果。还可以推理“我以为是苹果,但不是。”

终生的DNN会在其功能中捕获这种机制,因此,在确定已学习的模型时,它不会输出任何内容。

没关系,没问题

借助对苹果和香蕉为例的“无”的基本理解,现在让我们考虑一下在水果识别之外的实际应用中该如何发挥作用。

考虑一下制造业,那里的机器负责生产大量产品。培训传统的计算机视觉系统以识别产品中的不同异常现象(例如表面划痕)非常具有挑战性。在运行良好的生产线上,没有多少“坏”产品的样例,“坏”可以有无数种形式。根本没有关于不良产品的大量数据可用于培训系统。

但是,借助终生的DNN,开发人员可以训练计算机视觉系统来识别“好”产品的不同示例。然后,当系统检测到与商品定义不符的产品时,可以将该商品归类为异常,以进行适当处理。

对于制造商而言,终生的DNN和发现异常的能力可以节省时间并提高生产线的效率。对于无数其他越来越依赖人工智能的行业来说,可能会有类似的好处。

(0)
上一篇 2022年4月3日
下一篇 2022年4月3日

相关推荐