摩尔线程已开源其音频理解大型模型 MooER:该模型基于国产全功能GPU进行训练与推理。
编辑日期:2024年08月24日
基于摩尔线程夸娥(KUAE)智能计算平台,MooER 大模型在 38 小时内完成了对 5000 小时音频数据及其伪标签的训练。
MooER 不仅能够支持中文和英文的语音识别,还拥有从中文翻译成英文的语音翻译功能。在 Covost2 的中译英测试集里,MooER-5K 达到了 25.2 的 BLEU 分数,接近工业级别的效果。
摩尔线程的AI团队在这项工作中开放了推理代码和基于5000小时数据训练的模型,同时他们还计划进一步开放训练代码以及基于8万小时数据训练的模型。
MooER的模型架构包含编码器(Encoder)、适配器(Adapter)及解码器(大型语言模型,LLM)三个部分,具体参数规模如下:
附上相关链接:
大家在看
AI安装教程
AI本地安装教程
微软AI大模型通识教程
微软AI大模型通识教程
AI大模型入门教程
AI大模型入门教程
Python入门教程
Python入门教程
Python进阶教程
Python进阶教程
Python小例子200道练习题
Python小例子200道练习题
Python练手项目
Python练手项目
Python从零在线练习题
Python从零到一60题