学习辅助新方法有助于在有限数据上训练计算机视觉算法

Skoltech 的研究人员找到了一种方法来帮助计算机视觉算法更准确地处理地球的卫星图像，即使用于训练的数据非常有限。这将使机器以及最终使用其数据的人更容易执行各种遥感任务。概述新结果的论文发表在遥感杂志上。

一段时间以来，研究人员一直在使用计算机视觉和机器学习技术来帮助进行环境监测。看似乏味且容易出现人为错误的任务通常对算法来说是小菜一碟。但是，在神经网络能够成功区分森林区域中的树木种类之前，需要对其进行训练，这就是一个挑战。

卫星图像不是普通的手机照片，您可以在一瞬间拍摄十张照片：每个轨道可用的照片数量有限，分辨率有限，而且云总是会挡路。因此，获得足够多的标记良好的图像来训练神经网络可能会很麻烦，科学家和工程师已经以图像增强的形式创造了解决方法。

“虽然它们非常强大，但神经网络需要大量的训练数据才能获得最佳结果。不幸的是，在实际任务中，我们通常没有足够的数据。为了克服这个问题，数据科学家应用了各种技术来人为地增加数据集。最流行的方法之一称为图像增强。它转换图像以增加可，”Sergei Nesteruk，Skoltech 博士。该论文的学生和合著者解释说。

Skoltech 教授 Ivan Oseledets 和他的同事开发了一种称为 MixChannel 的增强方法，用于多光谱卫星图像。该方法基于用覆盖同一区域的另一日期图像中的相同波段替换原始图像中的波段。

“对通用 RGB 图像使用图像增强很容易。但是多光谱数据非常复杂，并且没有有效的方法来增强它。MixChannel 是一种新颖的增强技术，旨在专门处理多光谱数据，”另一位合作者 Svetlana Illarionova -论文作者和 Skoltech 博士学生，说。

为了测试他们的方法，该团队使用俄罗斯北部阿尔汉格尔斯克地区针叶树和落叶北方森林的 Sentinel-2 卫星图像来训练卷积神经网络来对这些森林进行分类。“训练 CNN 分类模型的一种直接方法是在植被活跃期间为给定领土获取一组可用卫星图像。训练集是通过获取大图像的随机补丁构建的……然而，如果我们在未包含在训练集中的日期拍摄的图像上测试获得的模型，则准确率可能会急剧下降，”作者写道。

由于阿尔汉格尔斯克地区通常多云，因此令人满意的卫星图像数量受到严重限制——实际上只有六张。但是，尽管样本量很小，但在使用三个神经网络进行测试时，新方法的表现优于最先进的解决方案，而且正如作者所指出的，它可以与其他增强方法相结合，以获得更多的训练数据。

这种方法可以帮助完成的其他与遥感相关的任务包括各种环境研究和精准农业——基本上只要你有中等空间分辨率的数据并且没有很多可用的图像。在进一步的工作中，科学家们将扩展该方法以处理更多土地覆盖类型和具有不同环境条件的更大区域。

学习辅助新方法有助于在有限数据上训练计算机视觉算法

相关推荐