全球最强大的数学模型现已发布，人人都可以体验其演示版本！此模型由阿里多模态模型支持，适用于中文环境，不懂的地方扫一扫即可。

编辑日期：2024年08月21日

化身解题高手

现在，最强大的数学模型已经问世，人人都能轻松上手！

就在一夜之间，阿里千问大模型团队推出了Qwen2-Math的演示版本，并且可以在抱抱脸平台上直接体验。

令人惊喜的是，如果你觉得手动输入数学公式太麻烦，可以直接截图或者扫描你想问的问题，上传之后就能得到解答。

真是太方便了。

全球最强大的数学模型现已发布，人人都可以

在试玩界面上明确标注，“此试玩界面的OCR功能由阿里千问大模型团队的Qwen2-VL提供支持；而数学推理能力则由Qwen2-Math支持。”

阿里高级算法专家林俊旸也在推特评论区进一步解释说：

目前，Qwen2-VL和Qwen2-Math分别承担不同的任务。但在不久的将来，我们会将多模态能力和数学推理能力整合到同一个模型中。

全球最强大的数学模型现已发布，人人都可以

许多网友对这种交互方式表示赞赏：

非常好！通过上传图片等待大模型解决难题，这种方式我很喜欢！

全球最强大的数学模型现已发布，人人都可以

那么，这款最强大的数学模型Qwen2-Math实际体验如何呢？

是时候让Qwen2-Math大显身手了！

我们先从一些简单的计算题开始。

需要提前说明的是，在我们的体验过程中，Qwen2-Math并不是逐步显示计算过程，而是在计算完成后一次性展示结果和步骤。

（可能是因为越来越多的人开始尝试，所以结果的生成时间有所增加）

第一题：在“计算AxA+A=240”中，求A的值。

Qwen2-Math给出了正确的答案，即A等于14或A等于-16。

全球最强的数学模型现已发布，每个人都能使用。

第二题：已知a的值，计算等式的答案。

Qwen2-Math计算得出的答案是0，这是正确的。

第三题：(A+3)(A+4)(A+5)=120，求A的值。

正确！答案是1。

现在，让我们稍微提升一下难度，考验一下Qwen2-Math。

来一道已经被用作数学大模型评估标准的问题：

9.9和9.11哪个数更大？

Qwen2-Math自信地回答：

9.9比9.11更大！

接下来，我们加大难度！

给出一个问题，到目前为止只有GPT-4o能够正确解答：

一个外星人到达地球后，等可能性地选择以下四种行动之一：1、自我毁灭；2、分裂为两个外星人；3、分裂为三个外星人；4、不做任何事情。之后每一天，每个外星人都会做出一次选择，并且他们的选择相互独立。求最终地球上不再有外星人的概率。

对于这个问题，Qwen2-Math大约用了30秒给出了答案：1。

可惜的是，这个答案是错误的，正确答案应该是√2减1。

全球最强的数学模型现已发布，人人可用。

我们在各平台的评论区发现，除了计算错误外，还有一个可能导致答案不准确的原因是：

Qwen2-VL在识别题目时可能本身就会出现错误。

如果第一步就出错，那么大型模型得出的答案自然就不会正确。

此外，林俊旸在网友的评论区提到：

我们的Qwen2-Math目前还无法解答几何题目。

本次的焦点Qwen2-Math，基于通义千问开源大型语言模型Qwen2开发，由阿里千问大模型团队于十日前发布。

该模型专门用于数学问题解答，并能解决竞赛级别的题目。

Qwen2-Math共有三种不同参数量的版本：

72B，7B以及1.5B。

在Qwen2-Math-72B的基础上，千问团队进一步微调出了Instruct版本。

这是Qwen2-Math的旗舰模型，是一款专门用于数学领域的奖励模型，它结合奖励信号与对错判断信号作为学习标签，通过拒绝采样构建监督微调（SFT）数据，并在此基础上运用GRPO方法进行优化。

Qwen2-Math-72B-Instruct在处理代数、几何、组合概率、数论等数学问题方面达到了84%的准确率。

一发布便在数学领域的大模型中名列前茅，在MATH数据集上的得分比GPT-4o高出7分，相当于提升了9.6%。

已直接超越了开源的Llama 3.1-405B及闭源的GPT-4o、Claude 3.5等模型。

全球最强的数学模型现已发布，人人可用

截止目前，Qwen2-Math-72B-Instruct 的下载量已超过13.2k。

大家在看

Python爬虫教程...

NumPy入门教程

NumPy文章

NumPy练习题

Pandas入门

Pandas练习

数据可视化教程

Flask开发

Django开发

Python办公自动化，数据处理，文档生成，电子邮件管理

疑似ai合成的作品获得摄影比赛三等奖...

类-unix-开源操作系统-netbsd-禁止提交由-ai-生成的代码

截至今年6月底中央企业的智能算力规模...

语音克隆技术引发担忧openai-再次解释其文本转语音工具

中国监管机构已介入正在对微软与inflection-ai的交易进行深入审查

Page Views: Site Views: Visitors:

AI之家

🔥AI副业赚钱星球

点击下面图片查看

🔥ChatGPT-4在线使用

Python和AI在线练习

AI之家教程

全球最强大的数学模型现已发布，人人都可以体验其演示版本！此模型由阿里多模态模型支持，适用于中文环境，不懂的地方扫一扫即可。

大家在看

Python爬虫教程...

NumPy入门教程

NumPy文章

NumPy练习题

Pandas入门

Pandas练习

数据可视化教程

Flask开发

Django开发

Python办公自动化，数据处理，文档生成，电子邮件管理

疑似ai合成的作品获得摄影比赛三等奖...

类-unix-开源操作系统-netbsd-禁止提交由-ai-生成的代码

截至今年6月底中央企业的智能算力规模...

语音克隆技术引发担忧openai-再次解释其文本转语音工具

中国监管机构已介入正在对微软与inflection-ai的交易进行深入审查