GANs是双面刃:协助打造更拟真的影像却也让网路上「假脸」横行

文:许志仲(国立屏东科技大学资讯管理系助理教授)、庄易修(国立屏东科技大学资讯管理系硕士生)

此篇报导为新兴科技媒体中心与《工商时报》合作,并刊载于〈科学家新视野专栏-AI伪造影像带来的危机〉

2012年以来,深度学习(Deep Learning)技术大爆发,电脑视觉(Computer Vision)与其他许多研究领域,纷纷投入深度学习的怀抱。

2014年,一种名为对抗生成网路(Generative Adversarial Nets, GANs)的概念被提出来,用于生成各种拟真的影像。自此之后,许多研究者纷纷投入GANs的改良研究,企图发展出更拟真的影像或视讯。

究竟GANs带来什么问题,有哪些最新研究趋势可以解决?

GANs是双面刃

就如同所有的技术一样,若被不当的使用,可能引发不可想像的严重后果。2018年,经过4年的改良,已经可以很容易生成非常逼真、且具有足够解析度的伪造影像。如图一所示,对于大多数的使用者来说,很难在短时间内辨识出真伪。

这也是GANs首度有接近自动化的能力,可以自动生成一个不存在的人的视讯资料;也可自动将既有的影片换上特定的脸部特徵。虽然早期是用于研究目的,且具有某些实用价值,例如生成人脸或生成任何影像,来扩充原本训练影像不够的情况,解决AI无法良好学习的问题。但不当使用却会带来严重的后果,特别是伪造合成的人脸影像。

例如,它可以用于Facebook或其他社群网站上,创建虚假的个人帐户,并且使用合成的脸部图像,来混淆某事或欺骗某人。更进一步的,GANs可能会用于创造和任何着名政治家十分相似的合成脸部,来发表演讲影片,造成社会、政治和商业活动的严重问题。

一个很好的例子是「Deepfake」以及相关的应用,被广泛用在许多不恰当的地方,例如合成色情影视讯等,已经严重危害到现今社群网路上的媒体可靠性。

根据一则最近的新闻指出,这类Deepfake软体合成出的伪造影片,甚至有机会影响选情(注1)。深度学习此类型的AI技术,特别是GANs,是把双面刃。既可应用于扩增资料、增强影像还原技术等正面研究,亦可刻意生成不当的影视讯来混淆视听、造成社会动乱。此一严重性,不可不正视之。

伪造影像的侦测与防治

在,对于伪造影像侦测的研究有限。2018年还尚未有任何学术论文,开始探讨伪造影像所带来的危害。全球也尚未开始重视伪造影像带来的危害与问题。

2018年中后段,全球才开始有一些研究团队意识到此问题之重要性,因此纷纷开始投入人力研究,利用AI来反制AI的伪造影像。一般来说,大多数的研究会採取监督式学习(Supervised Learning),将伪造影像辨识出来,方法上与其他做影像辨识的任务并无差别。

由于GANs改良的研究日新月异,要蒐集所有的GANs来训练将旷日废时。此外,若未来又有新的GANs产生,则伪造人脸检测器便须重新训练。

与以往纯监督式学习截然不同的策略之一,是採用成对学习(Pairwise Learning)[3)的概念,试图去找出不同GANs网路之间存在的共同瑕疵。藉此便可不需要蒐集所有的GANs,当新的GANs被提出来之后,亦不需要重新训练伪造人脸检测器。

我们首先在2018年中,研发出透过对比损失函数(Contrastive Loss),来学习五个具有代表性的GANs伪造影像的共同特徵,藉此来训练伪造人脸侦测器,可达八成五以上的準确率(注4)。2018年底我们改进方法后,引入三元损失函数(Triplet Loss)来强化共同伪造特徵的学习,并针对深度学习网路,提出了双重神经网路(Coupled Network)来加强效能。此项成果,更可达到约九成到九成五的準确率(注5)。

未来,这一类的伪造人脸影像侦测器可结合社群网路或媒体,审核上架照片、影片视讯的内容。若内容可能为伪造影像,则可进一步透过人工检视、或是自动屏蔽,降低不实的影视讯在网路上流窜的机率,进而达到伪造影像的防治。

全球联手对抗伪造影像

2019年初国际上开始重视这类议题,其中最早重视此议题的是慕尼黑工业大学,和义大利拿坡里费德里克二世大学,在2019年1月提出的伪造人脸资料库:Face Forensic++(注6)。

2019年10月,微软以及Facebook宣布,携手建立Join the Deepfake Detection Challenge(DFDC)。DFDC的主要目的跟FaceForensic一样,都是希望可以透过举办竞赛,收集全球有志人士针对侦测伪造影像视讯内容的演算法,并提高大家对于这些伪造影像的认知。

或许接下来会出现一个新的GANs,其效果远超越过去的GANs,使得所有的伪造影像侦测器都失效。亦有可能,有共同目标的研究团队,能发现GANs这类型伪造影像的致命缺点,瞬间止住伪造影像的流窜。然而我们可以确定的一点是,AI的攻防战会继续持续下去。

注释 Evan Halperstaff. (2019,11,05). Deep fake videos could upend an election — but Silicon Valley may have a way to combat them. Losangelas times. Karras, T., Aila, T., Laine, S., & Lehtinen, J. (2017). Progressive growing of gans for improved quality, stability, and variation. arXiv preprint arXiv:1710.10196. 成对学习与「配对法排序学习演算法Pairwise Learning to Rank」两者是不同的方法,但Pairwise learning也有人翻译成配对学习。 Hsu, C. C., Lee, C. Y., & Zhuang, Y. X. (2018, December). Learning to Detect Fake Face Images in the Wild. In 2018 International Symposium on Computer, Consumer and Control (IS3C) (pp. 388-391). IEEE. Zhuang, Y. X., & Hsu, C. C. (2019, September). Detecting Generated Image Based on a Coupled Network with Two-Step Pairwise Learning. In 2019 IEEE International Conference on Image Processing (ICIP) (pp. 3212-3216). IEEE. FaceForensic++是资料库全名,FaceForensic则是代表该收集资料库的计画名称。

本文经新兴科技媒体中心授权刊登,原文刊载于此

(0)
上一篇 2022年4月7日
下一篇 2022年4月7日

相关推荐