OpenAI发布高级推理o1模型
编辑日期: 2024-09-13 文章阅读: 次
GPT发布最新大模型,具有高级推理能力的大模型。 模型名字:o1-preview和o1-mini:
我实测了一波o1-preview,下面是实验过程:
1 先问它一道之前大模型都回答错误的题:
没问题,过关了。
2 我们直接上问题:动物过河,这个数学推理题,曾经难倒一众大模型,我们看看o1-preview是否能过关:
没问题,过关了。但这是最经典的题目,没有经过任何改造。
3 下面我改造题目,带一样调整为两样,即:
农夫需要把狼、羊和白菜都带过河,但每次只能带两样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。
再次提问它:
这次又没问题,过关了。
4 继续改造题目,带一样调整为两样,再多加一只羊:
农夫需要把1只狼、2只羊和1颗白菜都带过河,但每次只能带两样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。
再次提问它:
这次又没问题,过关了。
5 没有对比,就没有伤害,我们把问题2发给GPT-4o,看看它的回答情况:
上来第二道题目就回答错误了,结果是6,GPT-4o失败!
6 没有对比,就没有伤害,我们把问题3发给GPT-4o看看它的回答情况:
看起来是对的,但是仔细一看,发现有一个重大问题,最后一次过河,农夫只剩下羊了,怎么可能还带着狼过河,所以回答第3题,GPT-4o再次失败!
7 没有对比,就没有伤害,我们把问题4发给GPT-4o看看它的回答情况:
这次GPT-4o终于对了。
经过上面o1-preview和gpt-4o实验对比如下:
3次推理测试,o1-preview回答正确次数:3次,正确率:100%;
3次推理测试,gpt-4o回答正确次数:1次,正确率:33%.
结论:OpenAI发布的最新具有推理能力的o1-preview模型,已经具备很好的推理能力,至少相比gpt-4o,推理能力大幅提升。
当AI具有推理能力,再发展一段时间,具备意识后,后果我都不敢想了,一身冷汗。
你被o1-preview惊到了吗?实话实说,我被惊到了。。。
2 学习充电
希望看到这里的老铁们,尤其是土木工程等专业的同学,可以效仿同济大学的做法,多学习AI。
在这个技术飞速发展的时代,只有不断跟进技术,学习新技术,才能跟上时代脚步。想充电计算机IT、AI技术的老铁,我已经为大家准备了丰富的学习教程。
教程网站覆盖AI,编程,软件开发,爬虫,大数据分析,自动化,测试,运维等,当下很火的新技术,免费学习入口:
https://zglg.work