1702

title: 1 漏洞分析 date: 2024-11-28

title: AI大模型翻车，9.11 > 9.9 date: 2024-07-23

AI大模型在做数学运算时，现在还是很多漏洞。

今天聊一个漏洞，我会分析为什么会出现这个漏洞。

1 漏洞分析

GPT4o是前段时间发布的AI大模型，号称目前最强，我们问问它：9.11和9.9谁大？

它的回答：9.11大于9.9

这是一个小学生都能完全答对的问题，对于最强AI模型无法正确回答。

Claude号称也有很强的数学推理能力，但是给出的回答干净利落，9.11大于9.9：

同样翻车！

国内AI大模型，通义千问：

同样翻车！

天工AI：

同样翻车！

目前GPT4能正确回答：

因此，这几天做数学运算多的铁铁，建议使用：GPT4，估计过段时间，这个漏洞会被修复。

我们不禁要问，为什么？无所不能的AI大模型，为什么这种简单的大小比较，都无法正确作答？

AI大模型使用 token 方式，理解文字。

比如开源的 Tokenizer ，使用它，我们来观察大模型如何处理9.11和9.9谁大？

可以看出：

9 和小数点分别被分配为“24”和“13”，

小数点后的 9 同样也是“24”，

而 11 被分配到“994”。

这样问题就很清晰了，AI先比较了 9，发现大小相同，然后比较小数点后面的部分，发现 11 比 9 大，就给出了 9.11 更大的结论。

所以，知道原因后，我们再加一个浮点数条件：

AI 大模型在数学推理方面，还有很多事项要优化。

前途光明，但依然面临很多挑战。

最近我的网站：https://ai-jupyter.com，教程和练习题。

完全开源免费

部分教程截图：

练习题，选择并提交答案，立即给出对错和解析，目前已上线200+：

做练习题实际上是一种非常高效的学习方法。

看书容易犯困，大家可能不主动去思考。

但是通过有体系的做练习题，可能更容易理解和掌握知识。

Page Views: Site Views: Visitors: