title: 1 漏洞分析 date: 2024-11-28
title: 1 漏洞分析 date: 2024-11-28
title: AI大模型翻车,9.11 > 9.9 date: 2024-07-23
AI大模型在做数学运算时,现在还是很多漏洞。
今天聊一个漏洞,我会分析为什么会出现这个漏洞。
1 漏洞分析
GPT4o是前段时间发布的AI大模型,号称目前最强,我们问问它:9.11和9.9谁大?
它的回答:9.11大于9.9
这是一个小学生都能完全答对的问题,对于最强AI模型无法正确回答。
Claude
号称也有很强的数学推理能力,但是给出的回答干净利落,9.11大于9.9:
同样翻车!
国内AI大模型,通义千问:
同样翻车!
天工AI:
同样翻车!
目前GPT4能正确回答:
因此,这几天做数学运算多的铁铁,建议使用:GPT4,估计过段时间,这个漏洞会被修复。
我们不禁要问,为什么?无所不能的AI大模型,为什么这种简单的大小比较,都无法正确作答?
AI大模型使用 token 方式,理解文字。
比如开源的 Tokenizer ,使用它,我们来观察大模型如何处理9.11和9.9谁大?
可以看出:
9 和小数点分别被分配为“24”和“13”,
小数点后的 9 同样也是“24”,
而 11 被分配到“994”。
这样问题就很清晰了,AI先比较了 9,发现大小相同,然后比较小数点后面的部分,发现 11 比 9 大,就给出了 9.11 更大的结论。
所以,知道原因后,我们再加一个浮点数条件:
AI 大模型在数学推理方面,还有很多事项要优化。
前途光明,但依然面临很多挑战。
2 充电学习
最近我的网站:https://ai-jupyter.com,教程和练习题。
完全开源免费
部分教程截图:
练习题,选择并提交答案,立即给出对错和解析,目前已上线200+:
做练习题实际上是一种非常高效的学习方法。
看书容易犯困,大家可能不主动去思考。
但是通过有体系的做练习题,可能更容易理解和掌握知识。