奥特曼：O1只是“推理模型的GPT-2”；黄仁勋：我帮你提速50倍。

编辑日期：2024年09月20日

暗示o1满血版将在未来几个月内发布

在一场引人注目的活动中，AI领域的两位最具影响力的人物共同亮相：

OpenAI的CEO奥特曼暗示，o1的满血版将在接下来几个月内发布。

而英伟达的创始人黄仁勋则表示，新一代的Blackwell架构GPU能够使o1的推理速度提升50倍。

奥特曼：O1只是“推理模型的GPT-2”

奥特曼将o1在推理模型中的地位比作语言模型中的GPT-2阶段。他提到，几年后我们将见证“推理模型的GPT-4”，而在最近几个月内将会有显著的进步。新范式的进步曲线非常陡峭。

L2“推理者”与L1“聊天机器人”有很大的不同，目前人们还在探索如何利用这些模型，我们也尚未决定是否要为APP添加更多功能。

然而，最令人振奋的是L3“智能体”的到来将会非常迅速。

一位医学教授看到这些信息后，甚至已经开始考虑辞职。

奥特曼：O1只是“推理模型的GPT-2”

o1系列正式进入Lmsys大模型竞技场，并在首次分数结算中，在数学任务上表现出色，唯一的不足是回应稍显迟缓。

奥特曼：O1只是“推理模型的GPT-2”

对于这一问题，黄仁勋认为：

英伟达最新的Blackwell架构GPU将推理性能提升了50倍，这意味着可以将o1模型的响应时间从几分钟缩短至几秒。

以上内容来自于T-Mobile的资本市场日活动，T-Mobile刚刚与OpenAI签订了一项重要协议，合作建立一个人工智能支持的客服系统。

在这次活动中，除了几家公司之间的合作外，两位行业领袖还分享了许多关于AI现状和未来的值得关注的观点。

主持人： 首先，我想祝贺你们发布了o1模型。也许你可以向大家介绍一下这个新模型，因为它的表现确实让人惊叹。

Sam Altman： 是的，我们对这个成果感到非常兴奋，这是我们长期以来一直努力的方向。GPT系列模型在“系统1”类型的思维上表现出色，但我们真正追求的是能够进行推理的系统。

如果人工智能能够解决更复杂的问题，其潜在价值将是巨大的。你在GPT-4模型中已经看到了一些迹象，但o1是真正第一个能够进行高级推理的系统。无论是复杂的编程挑战、数学问题还是科学难题，都能得到非常出色的结果。我们相信，随着时间的推移，这将与GPT系列一样重要，并开启一系列新的、有价值的应用场景。

主持人： 你曾公开表示，我们现在看到的是预览版，而且它会迅速迭代。那么，在未来几个月内会发生什么呢？

Sam Altman： 我认为现在的情况类似于我们在GPT-2时期的状况。你会在未来几年内看到新型推理模型发展到与GPT-4相当的水平。即使在接下来的几个月内，你也会看到显著的进步，随着我们从o1-preview升级到o1正式版。

在这些新范式出现的时候，有很多有趣的事情发生，其中一个特点是改进曲线非常陡峭。一些目前无法解决的问题，可能在几个月后就能解决，几个月后再解决更多的问题。更重要的是，我们将看到一整套全新的应用场景，而不仅仅是聊天界面。我们需要一些时间来构建这些功能，其他人和用户也需要时间来适应。这与GPT模型有很大的不同。

我们谈到了AI的五个级别：L1是聊天机器人（ChatBot），L2是我们刚刚达到的推理者（Reasoner），L3是智能体（Agent），L4是创新者（Innovator），能够发现新的科学信息，L5是完整的组织（Organization）。

从L1到L2花了一些时间，但L2最令人兴奋的地方之一是它能相对快速地实现L3。我们预计这种技术最终将带来非常有影响力的智能体。

奥特曼：O1只是“推理模型的GPT-2” （省略一段商业互吹）

主持人：稍微转变一下话题，为什么 OpenAI 能够领先？在这个领域你们做了什么不同的事情，使你们能够以这样的速度开发这些模型？

Sam Altman：首先，谢谢你的赞美，这是一个非常好的评价。我们建立在之前大量工作的基础上，人工智能是一个古老的领域，人们长期以来一直在为其贡献非常出色的想法。想一想在整个人类历史中，人们为了发现半导体、制造芯片、建立网络和这些大型数据中心所需要的所有工作，我们只是在这些之上做了我们自己的一小部分。

但我们尽力做到最好，我们努力拥有一个非常专注的研究计划。我认为其他研究计划犯的错误之一是他们没有足够的信念和专注。一旦某些东西起作用，复制它非常容易。

所以我认为成功的两种方式是，要么成为一个出色的快速追随者，复制OpenAI或其他成功的公司所做的事情，我并不是以负面的方式说这个，因为我认为有很多公司只是等待看看什么有效，然后在改善和执行方面做得非常好。

要么试图推动前沿，这是非常困难的，需要在复杂的环境中跨越许多人拥有信念和专注，这是最好的前进方式。这就是我们努力去做的。

我们真的相信深度学习，我们真的相信从现在的位置到AGI及更远的道路，但我们愿意根据我们在过程中学到的东西进行纠正。我们将继续努力，以我们最大的力量去做下一件事，并相信随着时间的推移，这将产生福利效应。

这对我们来说确实有效，方法就这么简单。

（再省略一大段商业互吹和T-mobile业务内容）

主持人：我们刚才与 Sam Altman 讨论了人工智能的迅猛发展，其中一个关键点是 AI 需要极低的延迟和快速的响应时间。因为 AI 正在从传统的文本形式转向实时视频、面部表情和虚拟形象的互动，这就要求极高的响应速度。未来的 AI 工作负载将需要在网络边缘、靠近用户的地方进行计算。

黄仁勋：确实如此，我们现在正将无线电计算和 AI 计算融合到一个架构中。这台我们构建的计算机具有极低的延迟，CUDA 也具备极低的延迟，能够处理时间敏感的任务，提供高质量的语音服务所需的一切。

人们往往没有意识到，全球的无线网络其实是非常冗余的。之所以冗余，是因为在需要时必须提供极高的服务质量。但当没有人使用时，这些基础设施就处于闲置状态，可以被重新利用。

通过软件定义、加速化并使其能够处理 AI，我们现在将整个网络转化为在需要时可用于其他机会的过剩容量。这将是电信行业的一个巨大新增长机会。

主持人：非常有趣。我们还有几分钟的时间，在你离开之前，让我们换一个话题，谈谈你感到兴奋的事情。

英伟达拥有一个令人难以置信的视角，因为所有处于 AI 前沿的人士都在与你们合作。当你思考最具变革性的技术如何真正改变我们的生活时，是什么让你感到兴奋？你认为 AI 将如何影响我们所有人？

黄仁勋：我们都将拥有一批数字助手来辅助工作。我非常喜欢这个想法——我将拥有一台计算机，随着时间的推移，它会变得越来越聪明，理解我，并帮助我完成任务。我喜欢这种感觉，就像拥有了自己的 R2-D2 和 C-3PO（《星球大战》中的机器人）。

奥特曼：O1 只是“推理模型的 GPT-2”

我的R2将一直陪伴着我。对于许多年轻人来说，他们也会拥有自己的R2，陪伴他们的一生。这个R2既可以是数字版的，也可以是实体版的。无论是科学家、工程师、哲学家，还是普通人都能拥有这些令人惊叹的助手，帮助我们度过日常生活。（对于老黄关于机器人的这一观点，马斯克也在评论区表示赞同。）

奥特曼：O1只是“推理模型的GPT-2”

黄仁勋：最近，Sam提出了一种观点，即AI的推理能力将会变得越来越聪明，但这需要更多的计算能力。目前，在ChatGPT中，每个提示都是一条路径，未来将会有数百条路径。它将进行推理并进行强化学习，以提供更好的答案。

这就是为什么我们在Blackwell架构中将推理性能提升了50倍。通过将推理性能提升50倍，那些现在需要几分钟才能回答特定提示的推理模型，将来可以在几秒钟内做出回应。因此，这将是一个全新的世界，我对此感到非常兴奋。

主持人：你如何看待能耗的变化？这是AI领域最受关注的问题之一，即碳足迹。

黄仁勋：我们必须使用AI来减少能源消耗。我们现在知道，与使用传统超级计算机进行气候和天气预测相比，我们可以提高一万倍的能源效率。摩尔定律确实已经走到尽头，我们必须采用新的方法来解决这些计算问题。

我举的一个例子是，我的宠物狗并不懂牛顿物理学，它们不明白球的运动轨迹。我们知道，世界上第一台超级计算机是为了模拟导弹的轨迹而设计的。然而，狗经过一些训练后，可以轻松地从空中接住球，有时候还会在空中翻滚。那么它们是怎么做到的呢？这也是基于类似的思路。

因此，我们不会教人工智能（AI）通过物理学、动力学或流体力学来计算天气，而是教会它直接进行预测。尽管AI可能无法完全理解其中的因果关系，但其预测能力非常强大。我们关心的只是明天的天气如何。这是一个例子。同样地，我们也希望对无线电网络采取同样的方法。虽然我们了解电磁学的基本原理，知道无线电波束如何反射、折射，并能处理各种不同环境，也理解波束成形的物理原理，但在实际运行网络时，我们的目标是以更低的能耗、更高的吞吐量和更低的成本提供更好的服务。因此，我们无需实时进行基础物理模拟，而是可以利用AI来实现这一目标。这种方法——即先通过理解基本原理进行模拟，再用AI来模拟这种基础理解——能够极大地降低能耗。

人们需要注意的是，训练模型确实需要大量的能源。然而，我们的目标并不是不停地训练模型，而是要使用已经训练好的模型，这样将能节省大量的能源。

在同一时期Salesforce举办的另一场活动中，黄仁勋还提出了以下观点：

科技正处于一个正反馈循环中，AI正在设计下一代AI，其进步速度达到了摩尔定律的平方。这意味着在未来一到两年内，我们将见证令人惊讶且出乎意料的进步。

奥特曼：O1只是“推理模型的GPT-2”