跳转至

AI之家

最强端侧开源AI模型Zamba2-mini正式发布：拥有12亿参数，在4位量化的情况下，内存占用不到700MB。

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

最强端侧开源AI模型Zamba2-mini正式发布：拥有12亿参数，在4位量化的情况下，内存占用不到700MB。

编辑日期：2024年08月30日

注：SOTA（state-of-the-art）并非特指某个具体模型，而是指在某一研究任务中当前最先进、性能最好的模型。

最强端侧开源ai模型zamba2mini

Zamba2-mini 1.2B 尺寸虽小，但其性能可与包括谷歌的 Gemma-2B、Huggingface 的 SmolLM-1.7B、苹果的 OpenELM-1.1B 以及微软的 Phi-1.5 在内的较大模型相媲美。

在推理任务中，Zamba2-mini 的出色表现尤为突出。与 Phi3-3.8B 等模型相比，Zamba2-mini 的首次令牌时间（即从输入到输出第一个 token 的延迟）缩短到了之前的一半，内存占用也减少了 27%。

Zamba2-mini 1.2B 主要通过高度优化的架构实现，融合了不同神经网络设计的优势，不仅能够保持大型密集变压器的高质量输出，还能够以更小模型的计算和内存效率运行。

最强端侧开源ai模型zamba2mini

与前代Zamba1相比，Zamba2-mini的关键改进之一是集成了两个共享注意力层（attention layers）。

这种双层方法增强了模型在不同深度保持信息的能力，从而提升了整体性能。在共享注意力层中引入旋转位置嵌入也小幅提高了性能，这表明Zyphra致力于通过渐进且有影响力的设计改进来优化模型。

Zamba2-mini 是在包含三万亿个 token 的大规模数据集上进行预训练的，该数据集来源于 Zyda 以及其他公开来源。

最强端侧开源ai模型zamba2mini

这个庞大的数据集经过了严格的过滤和去重处理，以确保训练数据的质量达到最高标准，并在退火阶段进行了进一步优化，其中包括在1000亿个高质量的tokens上进行训练。

Zyphra 已承诺将 Zamba2-mini 作为开源模型发布，并采用 Apache 2.0 许可。

请提供参考地址。（如果需要更准确的回答，请提供更多信息或上下文）

大家在看

图标描述

图标描述

微软AI大模型通识教程

AI大模型开发

AI大模型入门教程

图标描述

Python入门教程

图标描述

Python进阶教程

图标描述

Python小例子200道练习题

图标描述

Python练手项目

Python从零到一60题

Python从零在线练习题

Python爬虫教程...

NumPy入门教程

NumPy文章

NumPy练习题

Pandas入门

Pandas练习

数据可视化教程

Flask开发

Django开发

Python办公自动化，数据处理，文档生成，电子邮件管理

无论是大型还是小型模型，讯飞星火都能轻松应对，实现智能体的无缝接入。这使得企业的工作变得轻便而高效，让繁杂的任务也能简洁流畅地完成。

马斯克对xai偏爱有加据报道他已经从...

百度推出了全新的智能编码辅助工具文心快码它涵盖了超过100种主流编程语言并且兼容多种集成开发环境ide该工具始终以中文进行回应致力于提供高效便捷的编码支持

英伟达的黄仁勋表示每个人将来都会拥有...

nothing-cmf-watch-pro-2-智能手表推出具备可替换表圈功能售价为-69-美元

Page Views: Site Views: Visitors:

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析