太火爆了!我在外滩大会上体验了Deepfake技术,本想骗过机器人,结果却……
编辑日期:2024年09月07日
AI 还得靠 AI 来治理
在外滩大会上,我尝试生成了一个 Deepfake(深度伪造),结果没能骗过机器人……
反而在一瞬间就被识破了!
机器人手中的“神兵利器”竟然只是我们日常使用的手机摄像头。
真是太火了!
Deepfake 攻防展示成为了外滩大会现场最受关注的展区之一;相关的讨论也成了最热门的论坛,现场人山人海。
之所以如此受关注,原因大家都已经知道。
最近,Deepfake 的发展迅猛,利用这种 AI 技术进行犯罪的行为引起了广泛关注,甚至有网友称之为“韩国 N 号房再现”。
提到的这场“全球 Deepfake 攻防挑战赛”吸引了来自 26 个国家和地区的 2200 多名技术研究者参与,共同对抗 Deepfake 威胁。在此期间,中国科学院自动化研究所宣布将开源其 AI 模型供所有人免费使用,这一举动引发了全网热议。
在外滩大会上,终于有机会亲自体验 Deepfake 从生成到对抗的全过程,了解 AI 如何帮助普通人识别伪造风险。
这背后究竟有哪些细节?还有哪些亮点?我们一起来看看。
首先,我们来看看蚂蚁数科展区里非常热门的“Deepfake攻防”项目。在这个过程中,你只需站在一个固定位置,让iPad拍摄你的人脸。
之后,现有的AI模型会生成换脸图像或视频。
接着,由机械臂从三组图片和一个视频中找出真实的照片。可以看出,这些视频非常逼真,让人难以分辨“我”是不是“我”。
在现场实时采集数据时,机械臂手持智能手机打开相机拍摄,随后进行识别操作。
短短几秒钟内,机器人就能识别出正确的答案。
根据现场工作人员的介绍,在日常工作中,最快可以在三秒内完成识别。
这一技术背后的支撑来自天玑实验室和安全品牌ZOLOZ。天玑实验室专注于可信数字身份领域,并自主研发了一套自动化生物识别测评体系。目前市场上70%的安卓手机都需要在天玑实验室接受严格的测试。该实验室也是谷歌在全球唯一的官方合作“安卓生物识别安全”检测实验室。
而ZOLOZ则是蚂蚁数科旗下的安全科技品牌,为包括中国、印尼、马来西亚、菲律宾在内的14个国家和地区的70多家合作伙伴提供技术服务,涵盖端到端身份验证、在线欺诈检测及持续风险监控等。
今年4月,他们推出了反Deepfake产品ZOLOZ Deeper。在外滩大会上展示的内容正是他们日常业务的真实场景——
数十万测试样本,每月超过20000次的攻防测评,模拟上百种伪造攻击情况……
同样以直观可感的方式展示的还有他们的AI标注场景。AI大模型生产流程通常包含以下三个步骤:采集-标注-合成。
首先来看采集过程。
现场准备了一个模拟真实环境的沙盘,通过控制机械臂可以对沙盘中的任意位置或场景进行实时拍照。
此时,图像数据会被传输到系统中,从而完成数据生产的起点。
接下来是标注步骤,不再依赖传统的纯人工方式,而是采用自主研发的多模态大模型来进行AIGD(AI生成数据)。
该模型能够自动完成目标检测与标注、语义分割、文本描述、深度检测及3D建模等任务。
人类主要负责协助审核工作,例如在文本描述阶段,需要人工审核目标的细节,如物体的颜色和形状等。
最后是数据合成阶段。其核心特点是可控性,既可以对单个物体进行编辑,也可以对整个场景进行把控。
这样一来,无需再次采集数据,即可打破原有真实条件的限制,持续生成全新的数据。
除了实景标注外,旁边还有一个视频标注模块,只需对任意视频中的任意一帧进行采集,便可完成后续的标注和合成操作。
这套全链路生产体系经过实际测试,在同类结构和规模的数据量下,可以将标注效率提升40%以上。
除了智能化标注产品,蚂蚁数科还配备了一支万人的人工标注团队,其中超过90%为垂直专业领域的高级标注人才。
提到数据标注,目前市场上最具代表性的公司无疑是 Scale AI,这家科技界的明星独角兽最近完成了近 10 亿美元的融资,估值达到 138 亿美元。
不过,与 Scale AI 不同的是,蚂蚁数科不仅提供数据标注服务,还提供了数据加工和合成服务。在一些企业的私有数据或特定垂直领域中,大量的数据尚未公开且未被充分挖掘。结合蚂蚁数科多年的技术和场景优势,除了帮助企业实现数据服务的“就地取材”外,还可以有针对性地进行数据泛化。例如,在交通、政务和金融等垂直场景中,生成更多的高质量数据。
此次外滩大会中,Deepfake 攻防与智能标注是蚂蚁数科最具代表性的展区内容。值得注意的是,这恰好是当前业界热议并广泛关注的两个问题:
- 当 AI 应用泛滥时,如何应对造假问题?
- 大模型加速落地时,如何解决高质量数据缺失的问题?
如今,随着大模型时代的到来,更多风险和问题逐渐暴露,给企业带来了不少挑战。深耕产业多年的蚂蚁数科,此次也带来了他们的解决方案。这些解决方案隐藏在外滩大会的这两个最受关注的产品中。
蚂蚁数科的整体业务布局可以总结为:“从 AI For Data 到 Data for AI”。
那么,何为“从 AI For Data 到 Data for AI”呢?要回答这个问题,需要从整个产业现状入手。
AI 发展至今,已经从模型驱动转变为数据驱动。随着数字化转型的深入,企业的生产经营实际上就是数据的流通。技术和场景、AI 和数据从未像今天这样紧密结合。业务场景需要 AI 来提效,而高质量的数据则需要充分利用以支持 AI 的发展。
一方面,AI for Data 是指利用 AI 充分挖掘数据的价值,进行数据分析和判断等。以风控场景为例,这是每个企业在经营过程中都会面对的场景。
蚂蚁数科构建了一套以决策式AI为核心的风控算法模型,该模型融合了诸如工商司法信息、财务报告、产业链动态、发票税务记录及舆情监控等多种数据来源,旨在帮助企业实现高效且精准的决策制定。在过去,依赖人工进行风险控制是一项费时耗力的任务,并且理解和迅速响应管理需求及制定策略充满挑战。而今,借助这一AI决策辅助工具,即便是初涉运营的新手也能从容应对复杂情境。
例如,在与中铁建的合作项目中,蚂蚁数科共同打造了一个结合“产业数据+AI模型”的产业风控平台,显著提升了产业链上的客户准入效率,增幅达到了至少50%。
此外,高质量的数据是AI模型训练不可或缺的基础。蚂蚁数科提供的涵盖数据服务、数据处理及数据标注的一体化解决方案,加速了企业将海量原始非结构化数据转化为高价值结构化数据的过程。
为了确保大规模模型在训练和使用过程中的安全性与可靠性,还推出了如蚁天鉴这样的大型模型安全产品。
我们观察到,蚂蚁数科已形成了由云服务(Cloud+)、人工智能服务(AI+)以及区块链服务(Blockchain+)组成的三大核心业务板块:
首先,云服务帮助客户进入数字化转型阶段,提供强大的技术支持;
其次,AI服务利用人工智能技术革新并优化风险管理和市场营销等应用场景,助力企业在新时代的竞争中脱颖而出;
最后,区块链服务通过技术创新建立行业信任,提高数字合作效率,促进数据资产流动。
对蚂蚁数科而言,“ABC”战略中的“A”尤为关键,其明确指向的是:此次展示的业务布局“从AI For Data到Data for AI”具有以下三个特征:
聚焦产业、深耕产业、赋能产业。真正运用AI创造产业价值,解决实际问题,这也是大规模模型应用的核心命题所在。
随着大规模模型的发展,人们对它的看法也在逐步转变。
从最近各行业的诸多问题与反思来看,图像和视频生成模型不断进步,但人们的关注点已不再仅仅停留在其令人惊叹的效果上,反而因效果过于逼真而担忧潜在的风险;原本旨在“缓解高质量数据短缺”的数据合成技术,却在《自然》杂志封面上被指出“垃圾进,垃圾出”的问题——数据合成得越多,可能导致语言模型崩溃,为这一新兴趋势泼了一盆冷水……此外,关于Scaling Laws(规模定律)的讨论也在进行中:在行业应用中,大规模模型的参数量究竟应该设定在多少才合理?是否真的是参数越多,模型性能就越好?
这些问题引发了另一个思考方向:大规模模型是否存在泡沫?
这种思考并不难理解。随着大规模模型技术的发展和深入应用,一方面,人们逐渐认识到这些模型的能力边界。参数量不再是衡量模型能力的核心指标,高质量数据的输入才是确保模型高性能的关键。另一方面,大规模模型进入了应用的深水区。产业界对AI的需求已不仅是单纯的技术追求,而是要解决实际问题,这才是衡量大规模模型价值的唯一标准。
随之而来的是各种应用场景中的挑战。以数据问题为例,目前市场上大多数通用的大规模模型都基于互联网上的公开数据集。尽管这些数据集数量庞大、种类繁多,但质量参差不齐,很多甚至是“脏”数据。对于专业和严肃的应用场景而言,一方面,更多高质量的行业数据通常是非公开的或属于企业内部,需要系统化的管理和转换;另一方面,大量的公开数据需要经过工程级别的清洗和标注,才能达到可用的标准。
因此,评估大规模模型在各行各业的应用时,不能简单地看其性能展示,而应关注如何与产业深度融合。那些已经在产业中长期投入的企业,具有天然的场景优势,更有可能将AI能力和影响力真正渗透到行业中去。
蚂蚁集团旗下的蚂蚁数科,便是其中之一。
— 完 —
由于提供的文本中包含图片链接,而图片内容无法直接转换为文字描述,我将根据文本部分进行重写:
-
“太火爆了!我在外滩大会上体验了Deepfake” Facebook表示出于安全考虑,不会开放源代码。
-
“从三个关键点来分析Deepfake技术”
-
“感受一下‘北京风格’的华盛顿州?”
-
“值得注意的是,在美国的弗吉尼亚州,使用Deepfake已经是违法行为。”
-
“请注意,你在网上关注的美女,可能是由DeepFake技术创造的。”
注:原文中的图片链接已被忽略。