OpenAI发布高级推理o1模型

编辑日期: 2024-09-13 文章阅读: 次

GPT发布最新大模型，具有高级推理能力的大模型。模型名字：o1-preview和o1-mini：

我实测了一波o1-preview，下面是实验过程：

1 先问它一道之前大模型都回答错误的题：

没问题，过关了。

2 我们直接上问题：动物过河，这个数学推理题，曾经难倒一众大模型，我们看看o1-preview是否能过关：

没问题，过关了。但这是最经典的题目，没有经过任何改造。

3 下面我改造题目，带一样调整为两样，即：

农夫需要把狼、羊和白菜都带过河，但每次只能带两样物品，而且狼和羊不能单独相处，羊和白菜也不能单独相处，问农夫该如何过河。

再次提问它：

这次又没问题，过关了。

4 继续改造题目，带一样调整为两样，再多加一只羊：

农夫需要把1只狼、2只羊和1颗白菜都带过河，但每次只能带两样物品，而且狼和羊不能单独相处，羊和白菜也不能单独相处，问农夫该如何过河。

再次提问它：

这次又没问题，过关了。

5 没有对比，就没有伤害，我们把问题2发给GPT-4o，看看它的回答情况：

上来第二道题目就回答错误了，结果是6，GPT-4o失败！

6 没有对比，就没有伤害，我们把问题3发给GPT-4o看看它的回答情况：

看起来是对的，但是仔细一看，发现有一个重大问题，最后一次过河，农夫只剩下羊了，怎么可能还带着狼过河，所以回答第3题，GPT-4o再次失败！

7 没有对比，就没有伤害，我们把问题4发给GPT-4o看看它的回答情况：

这次GPT-4o终于对了。

经过上面o1-preview和gpt-4o实验对比如下：

3次推理测试，o1-preview回答正确次数：3次，正确率：100%；

3次推理测试，gpt-4o回答正确次数：1次，正确率：33%.

结论：OpenAI发布的最新具有推理能力的o1-preview模型，已经具备很好的推理能力，至少相比gpt-4o，推理能力大幅提升。

当AI具有推理能力，再发展一段时间，具备意识后，后果我都不敢想了，一身冷汗。

你被o1-preview惊到了吗？实话实说，我被惊到了。。。

2 学习充电

希望看到这里的老铁们，尤其是土木工程等专业的同学，可以效仿同济大学的做法，多学习AI。

在这个技术飞速发展的时代，只有不断跟进技术，学习新技术，才能跟上时代脚步。想充电计算机IT、AI技术的老铁，我已经为大家准备了丰富的学习教程。

教程网站覆盖AI，编程，软件开发，爬虫，大数据分析，自动化，测试，运维等，当下很火的新技术，免费学习入口：

https://zglg.work

Site Views: Visitors: