近日,在第12届中关村论坛数字金融与科技金融大会上,蚂蚁数科的Deepfake检测方案荣获“金融科技技术创新与应用案例”奖项。蚂蚁数科凭借其旗下的天玑实验室,首次创建了大规模、高质量、多模态的Deepfake数据集,包含超过百万级的多媒体内容,精确模拟了真实金融风控环境中的Deepfake攻击案例,为评估现有金融领域Deepfake检测模型的性能提供了重要基准。在金融业务场景中,蚂蚁数科的多组测试数据集上Deepfake检测准确率超过98%,成功阻止了多起利用Deepfake技术进行的欺诈活动,保障了用户资产安全。
此数据集解决了以往金融领域Deepfake检测模型难以大规模训练和在真实环境中测试的问题,并从多模态分析角度推动了传统检测模型的发展。目前,该数据集已成为蚂蚁数科反深伪产品ZOLOZ Deeper对外服务客户的关键能力。
[图片:https://www.qewen.com/wp-content/uploads/2024/12/1734964381-20241223143301-6769749d49c82.jpg]
蚂蚁数科利用多达81种Deepfake技术生成高质量的合成图像,涵盖了多种伪造技术、复杂光照条件、背景环境和面部表情,以模拟复杂逼真的真实世界攻击环境。除了静态图像外,还收集并生成了包含声音的视频数据,包括100多种伪造技术类型,覆盖不同语种、口音和背景噪音,确保数据集的多样性和复杂性。
在数据预处理和标注阶段,蚂蚁数科对收集到的数据进行清洗和预处理,确保数据质量。通过专家团队对数据进行标注,明确每张图像或每个视频是否为Deepfake生成的内容,同时保证伪造痕迹的最小化,达到高度逼真的效果。此前,蚂蚁数科发布的AI数据合成与生产平台,在数据标注层面实现了“AI主导”,标注模型依赖人工标注量降低了70%以上。
此外,蚂蚁数科在2024年外滩大会发起了一场Deepfake攻防挑战赛,将Deepfake数据集作为比赛的基础训练和测试数据,吸引了全球26个国家和地区2200多名选手报名参赛。通过大赛选手贡献的算法方案,Deepfake数据集的攻击质量和检测难度得到了有效验证和评估。
随着人工智能技术的进步,Deepfake技术也在快速发展。这种技术利用深度学习算法,可以逼真地替换视频中的人脸。尽管Deepfake在娱乐和传媒等领域有积极的应用,但在金融领域,尤其是在身份验证和交易验证环节,Deepfake技术带来了新的风险。金融机构的身份验证系统通常依赖于生物识别技术,如人脸识别。一旦这些系统被Deepfake技术欺骗,可能导致严重的金融欺诈。
因此,开发针对Deepfake攻击的检测系统在金融领域变得尤为重要。然而,强大的Deepfake检测防御模型需要高质量、符合真实世界环境的人脸Deepfake数据集,因此如何构建模拟真实世界的数据集以及如何验证其有效性成为紧迫问题。
暂无评论