跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

全球最强大的数学模型现已发布,人人都可以体验其演示版本!此模型由阿里多模态模型支持,适用于中文环境,不懂的地方扫一扫即可。

编辑日期:2024年08月21日

化身解题高手

现在,最强大的数学模型已经问世,人人都能轻松上手!

就在一夜之间,阿里千问大模型团队推出了Qwen2-Math的演示版本,并且可以在抱抱脸平台上直接体验。

令人惊喜的是,如果你觉得手动输入数学公式太麻烦,可以直接截图或者扫描你想问的问题,上传之后就能得到解答。

真是太方便了。

全球最强大的数学模型现已发布,人人都可以

在试玩界面上明确标注,“此试玩界面的OCR功能由阿里千问大模型团队的Qwen2-VL提供支持;而数学推理能力则由Qwen2-Math支持。”

阿里高级算法专家林俊旸也在推特评论区进一步解释说:

目前,Qwen2-VL和Qwen2-Math分别承担不同的任务。但在不久的将来,我们会将多模态能力和数学推理能力整合到同一个模型中。

全球最强大的数学模型现已发布,人人都可以

许多网友对这种交互方式表示赞赏:

非常好!通过上传图片等待大模型解决难题,这种方式我很喜欢!

全球最强大的数学模型现已发布,人人都可以

那么,这款最强大的数学模型Qwen2-Math实际体验如何呢?

是时候让Qwen2-Math大显身手了!

我们先从一些简单的计算题开始。

需要提前说明的是,在我们的体验过程中,Qwen2-Math并不是逐步显示计算过程,而是在计算完成后一次性展示结果和步骤。

(可能是因为越来越多的人开始尝试,所以结果的生成时间有所增加)

第一题:在“计算AxA+A=240”中,求A的值。

Qwen2-Math给出了正确的答案,即A等于14或A等于-16。

全球最强的数学模型现已发布,每个人都能使用。

第二题:已知a的值,计算等式的答案。

Qwen2-Math计算得出的答案是0,这是正确的。

第三题:(A+3)(A+4)(A+5)=120,求A的值。

正确!答案是1。

现在,让我们稍微提升一下难度,考验一下Qwen2-Math。

来一道已经被用作数学大模型评估标准的问题:

9.9和9.11哪个数更大?

Qwen2-Math自信地回答:

9.9比9.11更大!

接下来,我们加大难度!

给出一个问题,到目前为止只有GPT-4o能够正确解答:

一个外星人到达地球后,等可能性地选择以下四种行动之一:1、自我毁灭;2、分裂为两个外星人;3、分裂为三个外星人;4、不做任何事情。之后每一天,每个外星人都会做出一次选择,并且他们的选择相互独立。求最终地球上不再有外星人的概率。

对于这个问题,Qwen2-Math大约用了30秒给出了答案:1。

可惜的是,这个答案是错误的,正确答案应该是√2减1。

全球最强的数学模型现已发布,人人可用。

我们在各平台的评论区发现,除了计算错误外,还有一个可能导致答案不准确的原因是:

Qwen2-VL在识别题目时可能本身就会出现错误。

如果第一步就出错,那么大型模型得出的答案自然就不会正确。

此外,林俊旸在网友的评论区提到:

我们的Qwen2-Math目前还无法解答几何题目。

本次的焦点Qwen2-Math,基于通义千问开源大型语言模型Qwen2开发,由阿里千问大模型团队于十日前发布。

该模型专门用于数学问题解答,并能解决竞赛级别的题目。

Qwen2-Math共有三种不同参数量的版本:

72B,7B以及1.5B。

在Qwen2-Math-72B的基础上,千问团队进一步微调出了Instruct版本。

这是Qwen2-Math的旗舰模型,是一款专门用于数学领域的奖励模型,它结合奖励信号与对错判断信号作为学习标签,通过拒绝采样构建监督微调(SFT)数据,并在此基础上运用GRPO方法进行优化。

Qwen2-Math-72B-Instruct在处理代数、几何、组合概率、数论等数学问题方面达到了84%的准确率。

一发布便在数学领域的大模型中名列前茅,在MATH数据集上的得分比GPT-4o高出7分,相当于提升了9.6%。

已直接超越了开源的Llama 3.1-405B及闭源的GPT-4o、Claude 3.5等模型。

全球最强的数学模型现已发布,人人可用

截止目前,Qwen2-Math-72B-Instruct 的下载量已超过13.2k。

最新发现是:

尽管开发团队表示Qwen2-Math主要面向英文环境,但即使给出中文问题,Qwen2-Math依然能够给出解答——只是答案会以英文形式呈现。

据透露,后续将推出支持中英文双语的版本。

参考资料:[1]https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo [2]https://x.com/Alibaba_Qwen/status/1825559009497317406 [3]https://x.com/JustinLin610/status/1825559557411860649

全球最强的数学模型现已发布,人人可用

解决一个问题可能需要尝试32次以选出最优解……

全球最强的数学模型现已发布,人人可用

适用于所有仅采用解码器架构的模型

全球最强的数学模型现已发布,人人可用

充分利用模型与硬件特性

全球最强的数学模型现已发布,人人可用

英伟达的研究人员表示,最具创意的论文已经出现! 全球最强的数学模型现已发布,人人可用

GPT-4等九大LLM无一例外

全球最强的数学模型现已发布,人人可用

实验显示,专家的分配与主题无关。

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析