跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

奥特曼:O1只是“推理模型的GPT-2”;黄仁勋:我帮你提速50倍。

编辑日期:2024年09月20日

暗示o1满血版将在未来几个月内发布

在一场引人注目的活动中,AI领域的两位最具影响力的人物共同亮相:

OpenAI的CEO奥特曼暗示,o1的满血版将在接下来几个月内发布。

而英伟达的创始人黄仁勋则表示,新一代的Blackwell架构GPU能够使o1的推理速度提升50倍。

奥特曼:O1只是“推理模型的GPT-2”

奥特曼将o1在推理模型中的地位比作语言模型中的GPT-2阶段。他提到,几年后我们将见证“推理模型的GPT-4”,而在最近几个月内将会有显著的进步。新范式的进步曲线非常陡峭。

L2“推理者”与L1“聊天机器人”有很大的不同,目前人们还在探索如何利用这些模型,我们也尚未决定是否要为APP添加更多功能。

然而,最令人振奋的是L3“智能体”的到来将会非常迅速。

一位医学教授看到这些信息后,甚至已经开始考虑辞职。

奥特曼:O1只是“推理模型的GPT-2”

o1系列正式进入Lmsys大模型竞技场,并在首次分数结算中,在数学任务上表现出色,唯一的不足是回应稍显迟缓。

奥特曼:O1只是“推理模型的GPT-2”

对于这一问题,黄仁勋认为:

英伟达最新的Blackwell架构GPU将推理性能提升了50倍,这意味着可以将o1模型的响应时间从几分钟缩短至几秒。

以上内容来自于T-Mobile的资本市场日活动,T-Mobile刚刚与OpenAI签订了一项重要协议,合作建立一个人工智能支持的客服系统。

在这次活动中,除了几家公司之间的合作外,两位行业领袖还分享了许多关于AI现状和未来的值得关注的观点。

主持人: 首先,我想祝贺你们发布了o1模型。也许你可以向大家介绍一下这个新模型,因为它的表现确实让人惊叹。

Sam Altman: 是的,我们对这个成果感到非常兴奋,这是我们长期以来一直努力的方向。GPT系列模型在“系统1”类型的思维上表现出色,但我们真正追求的是能够进行推理的系统。

如果人工智能能够解决更复杂的问题,其潜在价值将是巨大的。你在GPT-4模型中已经看到了一些迹象,但o1是真正第一个能够进行高级推理的系统。无论是复杂的编程挑战、数学问题还是科学难题,都能得到非常出色的结果。我们相信,随着时间的推移,这将与GPT系列一样重要,并开启一系列新的、有价值的应用场景。

主持人: 你曾公开表示,我们现在看到的是预览版,而且它会迅速迭代。那么,在未来几个月内会发生什么呢?

Sam Altman: 我认为现在的情况类似于我们在GPT-2时期的状况。你会在未来几年内看到新型推理模型发展到与GPT-4相当的水平。即使在接下来的几个月内,你也会看到显著的进步,随着我们从o1-preview升级到o1正式版。

在这些新范式出现的时候,有很多有趣的事情发生,其中一个特点是改进曲线非常陡峭。一些目前无法解决的问题,可能在几个月后就能解决,几个月后再解决更多的问题。更重要的是,我们将看到一整套全新的应用场景,而不仅仅是聊天界面。我们需要一些时间来构建这些功能,其他人和用户也需要时间来适应。这与GPT模型有很大的不同。

我们谈到了AI的五个级别:L1是聊天机器人(ChatBot),L2是我们刚刚达到的推理者(Reasoner),L3是智能体(Agent),L4是创新者(Innovator),能够发现新的科学信息,L5是完整的组织(Organization)。

从L1到L2花了一些时间,但L2最令人兴奋的地方之一是它能相对快速地实现L3。我们预计这种技术最终将带来非常有影响力的智能体。

奥特曼:O1只是“推理模型的GPT-2” (省略一段商业互吹)

主持人:稍微转变一下话题,为什么 OpenAI 能够领先?在这个领域你们做了什么不同的事情,使你们能够以这样的速度开发这些模型?

Sam Altman:首先,谢谢你的赞美,这是一个非常好的评价。我们建立在之前大量工作的基础上,人工智能是一个古老的领域,人们长期以来一直在为其贡献非常出色的想法。想一想在整个人类历史中,人们为了发现半导体、制造芯片、建立网络和这些大型数据中心所需要的所有工作,我们只是在这些之上做了我们自己的一小部分。

但我们尽力做到最好,我们努力拥有一个非常专注的研究计划。我认为其他研究计划犯的错误之一是他们没有足够的信念和专注。一旦某些东西起作用,复制它非常容易。

所以我认为成功的两种方式是,要么成为一个出色的快速追随者,复制OpenAI或其他成功的公司所做的事情,我并不是以负面的方式说这个,因为我认为有很多公司只是等待看看什么有效,然后在改善和执行方面做得非常好。

要么试图推动前沿,这是非常困难的,需要在复杂的环境中跨越许多人拥有信念和专注,这是最好的前进方式。这就是我们努力去做的。

我们真的相信深度学习,我们真的相信从现在的位置到AGI及更远的道路,但我们愿意根据我们在过程中学到的东西进行纠正。我们将继续努力,以我们最大的力量去做下一件事,并相信随着时间的推移,这将产生福利效应。

这对我们来说确实有效,方法就这么简单。

(再省略一大段商业互吹和T-mobile业务内容)

主持人:我们刚才与 Sam Altman 讨论了人工智能的迅猛发展,其中一个关键点是 AI 需要极低的延迟和快速的响应时间。因为 AI 正在从传统的文本形式转向实时视频、面部表情和虚拟形象的互动,这就要求极高的响应速度。未来的 AI 工作负载将需要在网络边缘、靠近用户的地方进行计算。

黄仁勋:确实如此,我们现在正将无线电计算和 AI 计算融合到一个架构中。这台我们构建的计算机具有极低的延迟,CUDA 也具备极低的延迟,能够处理时间敏感的任务,提供高质量的语音服务所需的一切。

人们往往没有意识到,全球的无线网络其实是非常冗余的。之所以冗余,是因为在需要时必须提供极高的服务质量。但当没有人使用时,这些基础设施就处于闲置状态,可以被重新利用。

通过软件定义、加速化并使其能够处理 AI,我们现在将整个网络转化为在需要时可用于其他机会的过剩容量。这将是电信行业的一个巨大新增长机会。

主持人:非常有趣。我们还有几分钟的时间,在你离开之前,让我们换一个话题,谈谈你感到兴奋的事情。

英伟达拥有一个令人难以置信的视角,因为所有处于 AI 前沿的人士都在与你们合作。当你思考最具变革性的技术如何真正改变我们的生活时,是什么让你感到兴奋?你认为 AI 将如何影响我们所有人?

黄仁勋:我们都将拥有一批数字助手来辅助工作。我非常喜欢这个想法——我将拥有一台计算机,随着时间的推移,它会变得越来越聪明,理解我,并帮助我完成任务。我喜欢这种感觉,就像拥有了自己的 R2-D2 和 C-3PO(《星球大战》中的机器人)。

奥特曼:O1 只是“推理模型的 GPT-2”

我的R2将一直陪伴着我。对于许多年轻人来说,他们也会拥有自己的R2,陪伴他们的一生。这个R2既可以是数字版的,也可以是实体版的。无论是科学家、工程师、哲学家,还是普通人都能拥有这些令人惊叹的助手,帮助我们度过日常生活。 (对于老黄关于机器人的这一观点,马斯克也在评论区表示赞同。)

奥特曼:O1只是“推理模型的GPT-2”

黄仁勋:最近,Sam提出了一种观点,即AI的推理能力将会变得越来越聪明,但这需要更多的计算能力。目前,在ChatGPT中,每个提示都是一条路径,未来将会有数百条路径。它将进行推理并进行强化学习,以提供更好的答案。

这就是为什么我们在Blackwell架构中将推理性能提升了50倍。通过将推理性能提升50倍,那些现在需要几分钟才能回答特定提示的推理模型,将来可以在几秒钟内做出回应。因此,这将是一个全新的世界,我对此感到非常兴奋。

主持人:你如何看待能耗的变化?这是AI领域最受关注的问题之一,即碳足迹。

黄仁勋:我们必须使用AI来减少能源消耗。我们现在知道,与使用传统超级计算机进行气候和天气预测相比,我们可以提高一万倍的能源效率。摩尔定律确实已经走到尽头,我们必须采用新的方法来解决这些计算问题。

我举的一个例子是,我的宠物狗并不懂牛顿物理学,它们不明白球的运动轨迹。我们知道,世界上第一台超级计算机是为了模拟导弹的轨迹而设计的。然而,狗经过一些训练后,可以轻松地从空中接住球,有时候还会在空中翻滚。那么它们是怎么做到的呢?这也是基于类似的思路。

因此,我们不会教人工智能(AI)通过物理学、动力学或流体力学来计算天气,而是教会它直接进行预测。尽管AI可能无法完全理解其中的因果关系,但其预测能力非常强大。我们关心的只是明天的天气如何。这是一个例子。同样地,我们也希望对无线电网络采取同样的方法。虽然我们了解电磁学的基本原理,知道无线电波束如何反射、折射,并能处理各种不同环境,也理解波束成形的物理原理,但在实际运行网络时,我们的目标是以更低的能耗、更高的吞吐量和更低的成本提供更好的服务。因此,我们无需实时进行基础物理模拟,而是可以利用AI来实现这一目标。这种方法——即先通过理解基本原理进行模拟,再用AI来模拟这种基础理解——能够极大地降低能耗。

人们需要注意的是,训练模型确实需要大量的能源。然而,我们的目标并不是不停地训练模型,而是要使用已经训练好的模型,这样将能节省大量的能源。

在同一时期Salesforce举办的另一场活动中,黄仁勋还提出了以下观点:

科技正处于一个正反馈循环中,AI正在设计下一代AI,其进步速度达到了摩尔定律的平方。这意味着在未来一到两年内,我们将见证令人惊讶且出乎意料的进步。

奥特曼:O1只是“推理模型的GPT-2”

视频回放链接:https://www.youtube.com/watch?v=r-xmUM5y0LQ&t=5145s https://www.youtube.com/watch?v=kfe3ajUYSdc

奥特曼:O1只是“推理模型的GPT-2”

人机大战更新

奥特曼:O1只是“推理模型的GPT-2”

英伟达也开始涉足数字虚拟人领域,首先以黄仁勋为原型。

以上链接及图片可能无效或无法访问,请根据实际情况调整。

奥特曼:O1只是“推理模型的GPT-2” 更强的人工智能股

奥特曼:O1只是“推理模型的GPT-2” 中国也有权阻止收购

奥特曼:O1只是“推理模型的GPT-2” 不到2005年同期的三分之一

奥特曼:O1只是“推理模型的GPT-2” 网友:科幻级别的AI正在我眼前构建

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析