不同的面孔集合

谷歌为研究目的创建巨大的deepfake数据集

图片来源:Dreamstime

谷歌已经公开了一个包含数千个人工智能操纵视频的库,希望研究人员可以使用它来开发检测欺骗性内容的工具。

“深度造假”指的是由深度学习模型创建或处理的照片、视频和音频剪辑。网上有越来越多的开源深度伪造生成方法,这意味着生成它们不需要什么专业技术。

深度造假经常结合不同的来源来创建视频的合成图像,例如将名人的脸转到色情演员的身体上。2019年5月,美国总统唐纳德·特朗普和多家主要新闻媒体分享了一段旨在羞辱美国众议院议长南希·佩洛西的篡改视频。由于这段视频是通过简单的人工程序制作的,因此不被认为是真正的深度造假(真正的“深度造假”往往看起来很真实,以至于很难识别是假的),但这一事件引发了人们对深度造假如何被用于邪恶目的的严重质疑。例如,在2020年美国总统大选的准备阶段,深度造假可能被用来操纵选民

现在,谷歌宣布发布一个大型deepfake视频数据集。谷歌的工作人员通过与28名“有偿并同意的演员”合作,录制了数百个演员说话、面部表情和执行常见任务的视频,创建了这个数据集。然后,研究人员使用开源深度伪造生成模型,基于这些视频创建了大约3000个深度伪造。

谷歌的一篇博客文章解释说:“虽然许多深度造假可能是为了搞笑,但也有一些可能对个人和社会有害。谷歌会认真考虑这些问题。”

数据集-哪些是供研究团体免费使用的-已被纳入FaceForensics基准测试工作,该工作由慕尼黑工业大学和那不勒斯费德里科二世大学运行,并得到谷歌的支持。谷歌希望研究人员能够使用这个真实和深度造假视频库来训练自动深度造假检测工具。

深度造假库将随着技术的发展而不断更新。

谷歌写道:“我们坚信,要支持一个蓬勃发展的研究社区,以减轻滥用合成媒体的潜在危害,今天我们在FaceForensics基准测试中发布的deepfake数据集是朝这个方向迈出的重要一步。”

尽管用于视频和音频操作的深度学习模型的迅速崛起已被公认为一个令人担忧的严重原因,因为它们在制造虚假信息方面的应用,但深度伪造工具也有对社会有益的应用,例如为医学成像生成训练数据,或将文本转换为听起来逼真的合成语音。

报名参加E&T新闻电子邮件让像这样的精彩故事每天都发送到你的收件箱。

最近的文章

Baidu
map