开源 AI 模型迎战闭源纪录?Meta Llama 3.1-405B 多项测试超越 OpenAI GPT-4。
编辑日期:2024年07月24日
这一成就在开源AI领域树立了崭新的里程碑,象征着开源模型首度有望超越现有最顶尖的闭源LLM模型。
如基准测试所显示,Meta Llama 3.1 在包括 GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem 与 winograd 的多项评测中超越了 GPT-4o。然而,在 HumanEval 和 MMLU-social sciences 测试中,则表现不及 GPT-4o。
值得注意的是,这些数据源于Llama 3.1的基础版本,这意味着通过后续的调整与优化,该模型的表现有望更上一层楼,在上述各项基准测试中取得更优异的成绩。
参考阅读: