跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

OpenAI发布高级推理o1模型

编辑日期: 2024-09-13 文章阅读:

GPT发布最新大模型,具有高级推理能力的大模型。 模型名字:o1-preview和o1-mini:

图片

我实测了一波o1-preview,下面是实验过程:

1 先问它一道之前大模型都回答错误的题:

图片

没问题,过关了。

2 我们直接上问题:动物过河,这个数学推理题,曾经难倒一众大模型,我们看看o1-preview是否能过关:

图片

没问题,过关了。但这是最经典的题目,没有经过任何改造。

3 下面我改造题目,带一样调整为两样,即:

农夫需要把狼、羊和白菜都带过河,但每次只能带两样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。

再次提问它:

图片

这次又没问题,过关了。

4 继续改造题目,带一样调整为两样,再多加一只羊:

农夫需要把1只狼、2只羊和1颗白菜都带过河,但每次只能带两样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。

再次提问它:

图片

这次又没问题,过关了。

5 没有对比,就没有伤害,我们把问题2发给GPT-4o,看看它的回答情况:

图片

上来第二道题目就回答错误了,结果是6,GPT-4o失败!

6 没有对比,就没有伤害,我们把问题3发给GPT-4o看看它的回答情况:

图片

看起来是对的,但是仔细一看,发现有一个重大问题,最后一次过河,农夫只剩下羊了,怎么可能还带着狼过河,所以回答第3题,GPT-4o再次失败!

7 没有对比,就没有伤害,我们把问题4发给GPT-4o看看它的回答情况:

图片

这次GPT-4o终于对了。

经过上面o1-preview和gpt-4o实验对比如下:

3次推理测试,o1-preview回答正确次数:3次,正确率:100%;

3次推理测试,gpt-4o回答正确次数:1次,正确率:33%.

结论:OpenAI发布的最新具有推理能力的o1-preview模型,已经具备很好的推理能力,至少相比gpt-4o,推理能力大幅提升。

当AI具有推理能力,再发展一段时间,具备意识后,后果我都不敢想了,一身冷汗。

你被o1-preview惊到了吗?实话实说,我被惊到了。。。

2 学习充电

希望看到这里的老铁们,尤其是土木工程等专业的同学,可以效仿同济大学的做法,多学习AI。

在这个技术飞速发展的时代,只有不断跟进技术,学习新技术,才能跟上时代脚步。想充电计算机IT、AI技术的老铁,我已经为大家准备了丰富的学习教程。

教程网站覆盖AI,编程,软件开发,爬虫,大数据分析,自动化,测试,运维等,当下很火的新技术,免费学习入口:

https://zglg.work

图片

京ICP备20031037号-1