MIT-IBM开发了一种更快的方法来训练视频识别AI

机器学习使计算机能够执行识别面部和读取医学扫描等功能。但是,当任务是解释视频和现实事件时,使机器学习成为可能的模型变得庞大而繁琐。MIT-IBM Watson AI Lab的一个团队认为他们有解决方案。他们提出了一种方法,可以减少视频识别模型的大小,加快培训速度并可以提高移动设备的性能。

诀窍在于改变视频识别模型如何查看时间。当前的模型在一系列图像中编码时间的流逝,从而创建了更大的计算密集型模型。麻省理工学院的IBM研究人员设计了一个时移模块,该模块在没有明确表示的情况下使模型具有时间流逝的感觉。在测试中,该方法能够训练深度学习视频识别AI的速度是现有方法的三倍。

时移模块可以使在移动设备上运行视频识别模型更加容易。麻省理工学院助理教授宋汉说:“我们的目标是使任何低功耗设备的人都可以使用人工智能。”“要做到这一点,我们需要设计高效的AI模型,该模型使用更少的能源并且可以在移动大量AI的边缘设备上平稳运行。”

通过减少训练所需的计算能力,该方法还可以帮助减少AI的碳足迹。它可以帮助Facebook和YouTube等平台发现暴力或恐怖镜头,还可以允许医院等医疗机构在本地运行AI应用程序,而不是在云中运行AI应用程序,从而可以使敏感数据更加安全。研究人员将在本月下旬的国际计算机视觉会议上的一篇论文中介绍他们的发现。

(0)
上一篇 2022年3月27日
下一篇 2022年3月27日

相关推荐