阿里国际翻译大模型已实现大规模商用，其效果和成本均领先于业界。

编辑日期：2024年10月17日

面向全球用户开放使用

在AI调用量最高的场景之一——机器翻译领域，阿里国际的AI团队取得了新的进展。

10月16日，阿里国际副总裁兼AI负责人张凯夫在接受彭博社专访时表示，阿里国际最新研发的Marco翻译大模型支持中、英、日、韩、西、法等15种全球主流语言。该模型已在阿里国际AI官网Aidge上发布，面向全球用户开放使用。

基于目前广泛使用的开源评测数据集Flores，Marco翻译大模型在BLEU自动评测指标上领先于市场上的标杆翻译产品，如Google翻译、DeepL和GPT-4。这意味着，Marco的AI翻译能力总体上已经超越了全球竞争对手，成为行业第一。

阿里国际翻译大模型已实现大规模商用，其效果

图：根据公开榜单数据的测评结果

Marco的主要优势在于其由大语言模型驱动，能够基于语境进行精准翻译，而不仅仅是根据字面意思，避免了产生令人啼笑皆非的歧义。例如，“你的宝贝正在路上”不会再被翻译成“Your baby is on the way”。以网络用语“尊嘟喜欢”为例，一些AI翻译产品会将其翻译为“Zundu likes it”，而在Marco大模型中，这句话被非常地道地翻译为“I really like it”。

那么，Marco是如何实现这一效果的呢？据介绍，Marco翻译大模型通过多语言数据筛选技术，如多语种混合语料甄别和多维度数据质量评估，获得了高质量、大规模的多语言数据。在此基础上，结合多语言的混合专家和参数扩张方法，在确保主要语言（如中、英）性能不下降的情况下，提升了其他语种的质量。同时，通过模型量化和加速、多模型规约等优化策略，大幅降低了大模型的服务成本，甚至与传统小模型相比，成本也具有优势。

目前，Marco大模型已经在大规模商业应用中取得成功。得益于阿里巴巴国际站在跨境电商领域的多年积累，Marco在这一领域的表现尤为突出。对于个人用户而言，Marco能够根据上下文提供高质量的翻译和良好的可读性，甚至支持不同的翻译风格，满足多样化的需求。

根据媒体的公开报道，阿里巴巴国际站去年成立了AI团队，并在过去的一年中在40多个场景中测试了AI能力，帮助50万中小商家优化了1亿款商品。商家对AI的需求也在不断增长，近半年的数据显示，商家对AI的调用量平均每两个月翻一番，目前AI的调用量已经突破了每天1亿次。

阿里国际翻译大模型已实现大规模商用，其效