跳转至

AI之家

AI 能“读懂”你的唇语，私语或将不再安全

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

AI 能“读懂”你的唇语，私语或将不再安全

编辑日期：2024年09月12日

具体效果如下：

（注：下文应接具体的效果描述。若没有更多内容则需要确认原文意图。）

在红毯上，布莱克・莱弗利小声地说：“好紧张”。虽然她笑着说话时，人们很难通过唇语辨认出她说的话，但AI却可以做到。

ai-能读懂你的唇语私语或将不再安全

一眼看去，只能看到侃爷那一排显眼的白牙（并非），他的唇语也很容易被破解。

ai-能读懂你的唇语私语或将不再安全

看完后，网友们纷纷开始评论，各种创意和想法层出不穷：

求“联名”型网友：快把它们和Siri结合一下吧！这样我就不用像个小傻子一样对着电脑大喊大叫了！

ai-能读懂你的唇语私语或将不再安全

测评型网友：我想用它来试试“固定电话画质”的视频！

注：这里可能是想表达一种较低画质的视频，但“座机画质”并不常见，可能是口误或者是新颖的说法。如果是这样的情境下，“固定电话画质”也并不是一个常见的表述，可能需要更明确地描述想要表达的内容。如果是指低质量或像素较低的视频，建议可以换成“低画质”或者“像素较低的”等常见表述方式。

ai-能读懂你的唇语私语或将不再安全

担心安全的网友说：我有点害怕，我想戴口罩了。（呜呜）

ai-能读懂你的唇语私语或将不再安全

量子位整理了一些视频，并亲自测试了 Readtheirlips 的使用效果，供大家参考。

先试了一下阿尔特曼在斯坦福的访谈视频，将生成的文本与原始对话进行对比，发现内容完全吻合。

当然，请提供您需要重写的文本内容。

而在面对经常使用小表情的老马时，Readtheirlips 的表现依然稳定。

当然，请提供您需要重写的文本内容。

不过，以上两个视频中的人物都是全程正面面对镜头的。

如果换成的是喜欢用手势辅助说话的小扎，那么“Readtheirlips”会直接显示错误信息。（视频中的人物并不是始终正对着镜头。）

ai-能读懂你的唇语私语或将不再安全

当主角换成卡帕西后，由于他说话速度过快，生成的文本出现了识别错误。（左侧为 Readtheirlips 生成，右侧为文字处理软件生成）

ai-能读懂你的唇语私语或将不再安全

最后，我们尝试上传了一个16分钟的视频，但Readtheirlips直接显示错误，无法识别内容。

ai-能读懂你的唇语私语或将不再安全

总结来说：

识别视频的时间大约在一分钟左右。

注：原句中的 "Readtheirlips" 看起来像是一个拼写错误或乱码，因此在重写时并未包含此部分。如果这部分有特定含义，请提供更多信息。

正如他们所标注的那样，如果人物的正面无法正对镜头，那么模型就很难给出正确的答案。

ai-能读懂你的唇语私语或将不再安全

而对于语速过快的视频内容，Readtheirlips只能识别出一部分。

对此，团队成员回答说：

ai-能读懂你的唇语私语或将不再安全

关于上传视频的时长限制，他们是这样说明的：

ai-能读懂你的唇语私语或将不再安全

看完亲测视频后，我们来聊一聊 Readtheirlips 的工作原理吧。

让我们看看它是如何读取人类唇语的：

首先，研究团队利用大量的标注数据（已知的唇部运动及其对应的文本内容）对模型进行训练。

在此基础上，用户需要上传一段包含说话者面部特写，特别是嘴部动作的视频。

然后，模型会对视频中的嘴部运动进行分析：首先通过面部检测识别出嘴唇的位置，接着提取嘴唇的几何特征（如形状、开合程度、运动轨迹等），最后分析说话过程中嘴唇的动态变化（包括速度、方向和形状的变化）。

然后，模型会将提取到的唇部特征与训练数据中的特征进行匹配，以识别出视频中人物所说的内容。

将识别到的词语或短语组成完整的句子，然后进行上下文的理解，确保句子的语法和语义正确无误。

最终将识别到的内容以文本形式输出。

ai-能读懂你的唇语私语或将不再安全

开发团队 Symphonic Labs 是一家初创公司，负责读唇语应用的开发。

注：原句中的"Readtheirlips"可能是指一款读唇语的应用，但是没有具体的产品名称，因此在重写时将其作为描述来处理。如果"Readtheirlips"是特定产品的名称，则应保持不变。

ai-能读懂你的唇语私语或将不再安全

领英上的信息显示，该公司在今年4月才刚刚成立，截至目前，公司的员工人数还不到10人。

ai-能读懂你的唇语私语或将不再安全

他们之前还开发了一款能够通过读取唇语实现实时文本转录的软件，名为Symphonic。

两个软件的体验链接都已经附上了，感兴趣的朋友可以去试一下~

试玩链接：ReadtheirLips

交响乐试玩链接：

请提供需要重写的文本内容，以便我为您处理。谢谢！

本文来源于微信公众号：微信公众号（ID：QbitAI），作者专注于前沿科技。

大家在看

图标描述

图标描述

微软AI大模型通识教程

AI大模型开发

AI大模型入门教程

图标描述

Python入门教程

图标描述

Python进阶教程

图标描述

Python小例子200道练习题

图标描述

Python练手项目

Python从零到一60题

Python从零在线练习题

Python爬虫教程...

NumPy入门教程

NumPy文章

NumPy练习题

Pandas入门

Pandas练习

数据可视化教程

Flask开发

Django开发

Python办公自动化，数据处理，文档生成，电子邮件管理

容联云推出全新的容犀大模型应用体系，旨在赋能产业智能化转型，推动数字智慧化进程。

微信和蚂蚁押注ai应用商店大型企业竞...

falcon-mamba-7b-开源...

挑战英伟达-amd背靠高通和富士康的初创公司耐能发布笔记本-npu-新品

小米小爱音箱正在陆续推送大模型小爱更...

Page Views: Site Views: Visitors:

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析