跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

摩尔线程已开源其音频理解大型模型 MooER:该模型基于国产全功能GPU进行训练与推理。

编辑日期:2024年08月24日

基于摩尔线程夸娥(KUAE)智能计算平台,MooER 大模型在 38 小时内完成了对 5000 小时音频数据及其伪标签的训练。

MooER 不仅能够支持中文和英文的语音识别,还拥有从中文翻译成英文的语音翻译功能。在 Covost2 的中译英测试集里,MooER-5K 达到了 25.2 的 BLEU 分数,接近工业级别的效果。

摩尔线程的AI团队在这项工作中开放了推理代码和基于5000小时数据训练的模型,同时他们还计划进一步开放训练代码以及基于8万小时数据训练的模型。

摩尔线程已开源其音频理解大型模型-moo

MooER的模型架构包含编码器(Encoder)、适配器(Adapter)及解码器(大型语言模型,LLM)三个部分,具体参数规模如下:

摩尔线程已开源其音频理解大型模型-moo

附上相关链接:

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析