阿尔特曼称O1仅为“推理模型的GPT-2”,而黄仁勋则表示“这将为你提供50倍的加速”。
编辑日期:2024年09月20日
英伟达创始人黄仁勋表示,新一代的Blackwell架构GPU能够将O1推理速度提升50倍。
阿尔特曼将o1在推理模型中的地位类比于语言模型中的GPT-2阶段。
几年后,人们将会看到“推理模型的GPT-4”,但在最近几个月里就会有重大改进,新范式的进步速度非常快。
不过,最令人兴奋的是L3级“智能体”将很快到来。
有些医学教授看到这里,已经开始考虑辞职了。
话说,o1系列正式登陆Lmsys大模型竞技场,首次分数结算时,在数学任务上遥遥领先,唯一的缺点是回答速度稍慢。
对此,老黄的观点是:
以上内容来自 T-Mobile 的资本市场日活动。T-Mobile 刚刚与 OpenAI 签订了一项大合同,双方将合作建立一个由人工智能支持的客户服务系统。
然而,在这次活动上,除了几家公司之间的合作外,这两位行业领袖还分享了许多关于人工智能现在和未来的值得关注的内容。
关于o1在数学和代码之外的任务表现,请参阅以下内容,这是由o1主导并由量子位协助整理的原文精译。
主持人:首先,我想恭喜你们推出了 o1 模型。也许你可以向观众介绍一下这个新模型,因为它真的非常惊人。
萨姆·奥特曼:是的,我们对此感到非常兴奋,这也是我们长期努力的方向。GPT系列模型在“系统1”类型的思维上表现出色,但我们真正追求的是能够进行推理的系统。
如果人工智能能够解决更复杂的问题,其价值将是巨大的。你在GPT-4模型中已初见端倪,但o1才是首个真正能进行高级推理的系统。无论是复杂的编程挑战、数学问题还是科学难题,它都能带来极为出色的表现。我们相信,随着时间的推移,这一技术将像GPT系列一样重要,并解锁一系列新的、有价值的应用场景。
主持人:您曾经公开表示,我们现在看到的是一个预览版,并且它将会快速迭代。那么,在未来的几个月里,我们可能会看到哪些变化?
萨姆·奥特曼(Sam Altman):我认为当前的新型推理模型类似于我们在GPT-2时代的情况。未来几年内,你会看到它发展到与GPT-4相当的水平。即便是在接下来的几个月里,你也会见证显著的进步,随着我们从o1-preview版本升级到o1正式版。
我认为,在新范式出现的时候,会有很多有趣的事情发生,其中一个就是进步的速度非常快。现在某些模型还无法解决的问题,可能在几个月后就能迎刃而解,并且再过几个月又能取得更多突破。更重要的是,我们将见证一系列全新的应用场景,而不仅仅局限于聊天界面。我们需要一些时间来开发这些功能,其他开发者和用户也需要时间来逐步适应。这种情况与 GPT 模型有着显著的不同。
我们讨论了人工智能的五个层级:L1 是聊天机器人(ChatBot),L2 是我们刚刚达到的推理者(Reasoner),L3 是智能体(Agent),L4 是创新者(Innovator),能够发现新的科学信息,L5 是完整的组织(Organization)。
从 L1 发展到 L2 确实花了一些时间,但我觉得 L2 最令人兴奋的一点在于它能够相对较快地迈向 L3。我们预期这一技术最终将带来非常有影响力的智能体。
(省略一段商业互相赞美)
注:「商业互吹」通常指的是企业或商业伙伴之间互相夸赞、赞扬的行为,可能含有一定的客套成分。重写的句子用「商业互相赞美」表达了相同的意思。如果上下文需要更正式的表达方式,可以进一步调整措辞。
主持人:换个话题,为什么 OpenAI 能够保持领先?在这个领域,你们做了哪些与众不同的事情,使得你们能够以如此快的速度开发这些模型?
Sam Altman:首先,感谢你的赞扬,这真是一个极高的评价。我们是在前人大量工作的基础上取得进展的。人工智能是一个历史悠久的领域,长期以来,人们一直在为它贡献出许多杰出的思想。想想整个人类历史上,为了发现半导体、制造芯片、建立互联网和这些大型数据中心所需的所有努力,我们只是在此基础上做出了自己的一点小小贡献。
但我们尽力做到最好,我们努力制定一个非常专注的研究计划。我认为其他研究计划常犯的一个错误是缺乏足够的信念和专注。一旦某种方法奏效,复制它就变得很容易。
所以,我认为成功的两种方式之一是,要么成为一个优秀的快速追随者,复制像OpenAI或其他成功企业所做的事。我这么说并没有负面的意思,因为确实有很多公司只是在等待和观察哪些方法有效,然后在改进和执行上做得非常出色。
注:原文中提到的“两种方式”中的另一种方式未给出,但不影响该部分表达的完整意思。
我们要么尝试推动前沿,这非常困难,需要在复杂环境中让许多人保持信念和专注。这是我们认为最好的前进方式,也是我们努力去做的。
我们确实相信深度学习,并且认为从当前阶段通往AGI及更远的未来是可能的,但我们也会根据在这一过程中获得的知识做出相应的调整。我们将继续尽最大努力推进下一个项目,并相信随着时间的推移,这些努力将会带来积极的效果。
这对我们确实有效,方法就是这么简单。
(再次省略大量商业互赞和T-mobile业务介绍内容)
主持人:我们刚刚与 Sam Altman 讨论了人工智能的飞速发展。其中一点是,AI 需要非常低的延迟和快速的响应时间。因为 AI 正在从传统的文本形式转向实时视频回应、面部表情识别以及与虚拟形象的互动,这一切都需要极高的响应速度。未来的 AI 工作负载将需要在靠近用户的网络中具备强大的计算能力。
黄仁勋:确实如此。我们现在将无线电计算与AI计算整合到一个架构中。我们所构建的这台计算机拥有极低的延迟,CUDA也同样具备极低的延迟,能够处理对时间敏感的任务。这一切都为提供高质量的语音服务打下了基础。
人们往往没有意识到,全球的无线网络存在着大量的冗余。这种冗余的原因在于,为了在有人需要时提供极高的服务质量,我们建设了大量的基础设施。然而,在没有人使用的时候,这些设施就会处于闲置状态,这时它们就可以被重新利用。
因此,当我们通过软件定义、加速并使其能够处理AI,我们实际上是将整个网络转变为在需要时可以用于其他机会的多余容量。这将为电信行业带来一个巨大的新的增长机遇。
主持人:我非常喜欢。不过,在我们还有几分钟的时间里,让我们换个话题,在你离开之前,谈一谈让你感到兴奋的事情。
英伟达拥有一个令人难以置信的视野,因为所有在人工智能前沿工作的人都在与你们合作。当我们思考这一生中最具变革性的技术将如何真正改变人们的生活时,是什么让你感到兴奋?你认为人工智能将如何影响我们所有人?
黄仁勋:我们都将拥有一大批数字助手与我们一起工作。我非常喜欢这个想法,那就是我将拥有一台计算机,它会随着时间的推移与我一起工作,变得越来越智能,逐渐理解我,并帮助我完成任务。我很期待能拥有自己的R2-D2和C-3PO(《星球大战》中的机器人)。
我的R2将会一直陪伴着我。对很多年轻人而言,他们也将拥有属于自己的R2,陪伴他们走过一生。这个R2可以是数字版的,也可以是实体版的。无论你是科学家、工程师、哲学家,还是普通百姓,人人都可以拥有这样一位令人惊叹的助手,帮助我们度过每一天。
(对于老黄关于机器人的观点,马斯克也在评论区表示赞同。)
黄仁勋:最近,Sam 表达了一个观点,即这些 AI 的推理能力将会变得更加强大,但这需要更多的计算资源。现在,在 ChatGPT 中,每个提示都是一条单独的路径,而未来则会在内部发展出数百条路径。AI 将会通过推理和强化学习来为你提供更优质的答案。
这就是我们在Blackwell架构中将推理性能提升50倍的原因。通过实现50倍的性能提升,那些原本需要几分钟来响应特定提示的推理模型,现在可以在几秒内做出回应。因此,这将开启一个全新的世界,让我感到非常兴奋。
主持人:你如何看待能源消耗方面的变化?这是人工智能领域备受关注的一个方面,即碳足迹。
黄仁勋表示:我们必须运用人工智能来降低能源消耗。现在我们已经了解到,相较于使用传统的超级计算机进行气候和天气预报,我们可以将能源效率提高一万倍。摩尔定律的确已经接近极限,我们必须采用新的方法来处理这些计算任务。
我举一个例子:我的小狗并不懂牛顿物理学,也不理解球的运动轨迹。我们都知道,世界上第一台超级计算机是为了模拟导弹轨迹而创建的。然而,狗经过一些训练后,可以轻松地从空中接住球,有时候甚至在空中翻腾。那么,它们是怎么做到的呢?这背后也是同样的原理。
因此,我们将教会AI不是通过物理学、动力学或流体动力学来计算天气,而是让它直接进行预测。虽然AI可能不完全理解其中的因果关系,但它的预测能力非常强。我们关心的只是明天的天气如何。这是一个例子。同样地,我们也想对无线电网络进行这样的处理。我们已经理解了电磁学的基本原理,知道无线电波如何反射和折射,以及在不同环境中如何处理这些现象,并且掌握了波束成形的物理原理。
然而,在运营网络时,你的目标只是以更低的能耗、更高的吞吐量和更低的成本来提供更好的服务质量。因此,你并不需要实时进行基础物理模拟,而是可以借助人工智能来实现。这种方法首先通过理解基本原理进行模拟,然后利用AI来复制这种基础理解,从而大幅降低能源消耗。
人们需要认识到,训练模型确实需要大量的能源。然而,我们的目标并不是不停地训练模型,而是使用已经训练好的模型,这样可以大大节省能源。
在同一时期,黄仁勋在Salesforce举办的一场活动中还分享了以下观点:
这意味着在未来一到两年内,我们将见证惊人且出乎意料的进步。
视频回放:
(注:原文并未提供具体的文本内容,仅提供了三个词语,因此此处保持同样简洁的表述)
本文来源于微信官方账号:量子位(标识号:QbitAI),撰稿人:梦晨