跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

智谱AI宣布GLM-4-Flash大模型免费开放,支持包括中文、英语、日语、韩语在内的26种语言。

编辑日期:2024年08月27日

GLM-4-Flash 适用于完成简单的垂直任务,具有低成本和快速响应的特点,生成速度可达 72.14 tokens/s,相当于约 115 字符/s。

GLM-4-Flash具备多轮对话、网页浏览、函数调用(Function Call)和长文本推理(最大支持128K上下文)等功能,同时支持26种语言,包括中文、英语、日语、韩语和德语等。

官方表示,通过采用自适应权重量化、多种并行化方法、批处理策略以及投机采样等技术,在推理层面实现了模型延迟的降低和速度的提升。更高的并发量和吞吐量不仅提高了效率,还显著降低了推理成本,从而使得该模型能够免费推出。

在预训练方面,官方将大型语言模型引入数据筛选流程,获得了 10TB 的高质量多语言数据,数据量超过 ChatGLM3-6B 模型的 3 倍;同时采用 FP8 技术进行预训练,提升了训练效率和计算能力。

以下是相关链接:

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析