跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

首度公开亮相!无问芯穹推出前所未有的千卡级异构芯片集成训练平台

编辑日期:2024年07月05日

在2024年世界人工智能大会的AI基础设施研讨会上,无问芯穹的联合创始人及CEO夏立雪推出了创新的全球首例千卡级异构芯片混训系统,该系统能将异构混合训练集群的计算力利用率提升至97.6%。此外,夏立雪还宣布无问芯穹的Infini-AI云端平台已整合了大模型的千卡级异构混训功能,成为全球首个支持单一任务下千卡规模异构芯片混合训练的平台,并具有扩展至万卡的能力。该平台兼容AMD、华为昇腾、天数智芯、沐曦、摩尔线程和NVIDIA六种不同架构的芯片,用于大模型的混合训练。自7月起,经过试用申请的用户可以在Infini-AI平台上轻松启动包含700亿参数的大型模型训练。

img

四个月以前,无问芯穹的Infini-AI大模型开发与服务平台启动了首次公开测试,吸引了智谱AI、月之暗面和生数科技等知名大模型企业成为其稳定的异构计算力用户。此外,超过20家AI初创公司正借助Infini-AI的预设模型API不断优化自身的业务模型。此番推出全球首例能支持上千张异构芯片协同训练的平台,彰显了无问芯穹在异构计算优化和集群系统设计领域的深厚技术和创新实力,也是其实现“MxN”中间层生态理念的重要里程碑。

训练和推理作为大模型生命周期中的关键环节,都离不开高效计算资源的支持。中国在模型层和芯片层呈现出更为“多样化”的局面,与国际上的集中趋势形成对比。然而,众多的异构芯片也制造了“生态壁垒”,各个硬件生态系统独立封闭,导致算力使用者面临严峻的技术难题。

img

据统计,中国的超大规模算力集群数量已超过一百,这些集群正逐步从同质化转向多元化,以减轻对单一硬件平台的过度依赖和应对供应链风险。国产芯片性能的迅速提升为集群提供了更多选择。然而,存在的“生态竖井”障碍使得多数企业和开发者难以充分利用这些算力资源,导致了算力的浪费。这种现象已成为建立AI原生基础设施的关键难题,并加剧了当前大型模型行业面临的“算力短缺”问题。

为了适应多样化的模型和芯片环境,一个理想的解决方案是构建一个能够高效整合异构算力资源的平台,并提供支持软硬件协同优化的中间件,以将异构芯片转化为强大的计算力。这一创新背后的驱动力源于无问芯穹研发团队在异构芯片计算优化和集群系统设计方面的深厚实力。最近,无问芯穹携手清华大学和上海交通大学的研究团队推出了HETHUB,这是一个开创性的异构分布式混合训练系统,适用于大规模模型,首次实现了六种不同品牌芯片的交叉混合训练,并具有高度的工程化成熟度。据夏立雪介绍,该技术的工程化目标是整合异构算力,不断提升大型模型的技术潜力,同时通过打破芯片生态壁垒,降低大型模型实际应用的成本。

img

当前,大型语言模型行业正迈入大规模产业应用的新阶段,多样化的应用场景催生了对模型训练的急切需求,广阔的市场潜力促使基础模型和计算芯片领域的竞争者迅速增加。建立适应大模型时代的人工智能原生基础设施,对于为AI开发者提供更普适、高效且易用的开发平台至关重要,同时也是整合计算资源、保障AI产业持续发展的基石。

无问芯穹凭借其卓越的AI计算优化能力和算力解决方案,以及对多模态模型和多种芯片行业趋势的洞察,率先打造了一个“MxN”架构的生态系统,实现了各种大模型算法在不同芯片上的高效一致部署。至今,Infini-AI已支持包括Qwen2、GLM4、Llama3、Gemma、Yi、Baichuan2、ChatGLM3系列等超过30个模型,以及AMD、华为昇腾、壁仞、寒武纪、燧原、海光、天数智芯、沐曦、摩尔线程、NVIDIA等十多种计算卡。

img

我们矢志成为AI原生基础设施的先行者,不断挑战异构计算效能优化和集群系统架构的技术边界。我们将不懈强化模型层和芯片层的生态合作伙伴网络,共同努力实现“MxN”的无缝连接、高效运用和深度融合,打造真正适用于多元模型和芯片的AI原生基础设施。我们的目标是消除AI计算的使用难题,推动大模型在各行各业的创新应用。

img

技术的极限挑战与技术普及并不冲突,这完全取决于我们对技术的态度。正如夏立雪所言,如今谈论使大模型的成本降低一万倍,就如同三十年前设想每个家庭都能用上电一样具有革命性。优质的基础设施就像施展魔法一般,一旦其边际成本降至关键点,新技术将被更广泛地接纳和应用。

img

性能提升至FP16的2.65倍

img

每秒五十万枚令牌

img

构建人工智能的独特个性

img

联发科技在年初推出的天玑8100芯片凭借其优秀的能效比和良好的性能,在中端市场中脱颖而出。现在,该公司正加快步伐,天玑9200发布后不久,便推出了天玑8100的升级版——天玑8200。那么,这款新推出的天玑8200性能究竟怎样?是否有可能成为次旗舰手机的热门选择呢?

img

最经济实惠的大型模型

img

采用台积电代工技术,运算能力超过400TOPS,仅提供改写后的文本,始终使用中文回应。

以上全文,欢迎继续阅读学习

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析