跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

阿里大模型元老杨红霞的去向已正式公布:她已加入香港的一所高校任职!同时有消息透露,她的创业项目也在积极推进中。

编辑日期:2024年07月28日

阿里大模型元老杨红霞的去向已正式公布她已

杨红霞是一位著名的AI领域科学家。她曾任职于IBM T.J.沃森研究中心担任研究员,并在雅虎担任首席科学家。2016年,她加入了阿里巴巴,在达摩院的智能计算实验室工作;并于2023年3月转投字节跳动。

她在达摩院期间主导了通义千问的前身 M6 大模型的研发工作,是推动 M6 大模型从百亿、千亿参数量升级至万亿规模的关键人物,并领导开发了通义大模型的核心技术“统一学习范式 OFA-M6”。

在字节跳动任职期间,她的主要职责是大型模型的研发工作,向上级汇报的对象是字节AML和豆包大模型Foundation团队的负责人项亮。

在今年5月,有报道指出杨红霞已离开字节跳动,并传言她计划在大型模型领域创立企业。而现在,她进入学术界的消息却抢先一步曝光。在此之前,杨红霞并未在任何高等院校担任过正式职务,仅是担任过浙江大学上海高级研究院的兼职教授。

杨红霞本科毕业于南开大学统计学专业,后在杜克大学攻读博士学位。她已在顶级会议和期刊上发表了100多篇论文,并在美国和中国拥有超过50项专利。她的主要研究领域包括贝叶斯统计、时间序列分析、时空建模、生存分析、机器学习、数据挖掘以及它们在商业分析和大数据领域的应用。

阿里大模型元老杨红霞的去向已正式公布她已

博士毕业后,她首先在IBM T.J.沃森研究中心担任研究员。随后,她加入了雅虎,担任计算广告的首席数据科学家,主要负责开发与广告投放预测相关的算法。

2016年,杨红霞从海外回到中国并加入阿里巴巴,在达摩院的智能计算实验室任职。在此期间,她最重要的贡献是推动了M6大型模型的研发与扩展工作。这一多模态模型是通义千问的前身,并为阿里巴巴当前在大型模型领域的竞争力奠定了关键的基础。

阿里大模型元老杨红霞的去向已正式公布她已

M6项目在启动研发后约一年的时间内,迅速实现了从亿级到十万亿级的规模扩展。该项目于2020年6月启动,2021年5月即发布了拥有万亿参数规模的M6并投入实际应用。到了2021年10月,M6正式成为全球首个拥有十万亿参数的多模态大型模型。

不仅成为了当时全球最大的中文多模态模型,而且还迅速赶上了谷歌的步伐,在文本生成图像和商业化等领域达到了世界一流的水准。在绿色低碳方面,相较于GPT-3,M6在同等参数规模下所需的能耗仅为其1%。

这项工作是由阿里和清华共同开发的,其中杨红霞和唐杰共同担任通讯作者。

阿里大模型元老杨红霞的去向已正式公布她已

其他主要成员正是通义千问研发的核心团队,例如An Yang和Rui Men。M6的共同第一作者林俊旸目前是通义千问开源项目的负责人。

阿里大模型元老杨红霞的去向已正式公布她已

2022年9月,达摩院正式发布了“通义”大模型系列,构建了业界首个AI通义底座,并形成了大小模型协同工作的层级式人工智能系统。该通义底座中的M6-OFA模型是在杨红霞的领导下完成的。这一模型首次实现了模态表示、任务表示和模型结构的统一,在不增加新结构的情况下,单个模型能够同时处理超过10种跨模态任务,升级后更是能处理超过30种。该项目已经开源,截至目前已被引用超过900次,在GitHub上获得了2.4k的星级评价。

阿里大模型元老杨红霞的去向已正式公布她已

就在这个重大发布一个月后,杨红霞被报道因为家庭原因从达摩院离职。

下一次的新动态出现在2023年3月。有消息称她已经加入了字节跳动的AML(机器学习系统)团队,担任大型语言模型研发的技术专家一职,在美国西雅图负责大型语言模型的研发工作。

仅仅过了一年的时间,她便再次离开了字节。与此同时,行业的发展趋势也已从基础的大模型开发,逐渐转向更为细分的应用实施领域。

值得一提的是,之前有猜测称杨红霞的下一步将是投身于“端侧模型”的创业项目,并布局AI Agent领域。据5月份的消息,她的团队正处于筹备阶段,目前已经获得了3000至4000万美元的投资,投资后的估值达到了1.5亿美元。

最近,据量子位从知情人士那里了解到的消息,杨红霞不久前还在西雅图筹备一个全球化的AI项目。从各方面情况来看,杨红霞加入香港理工大学可能与她的创业活动并不冲突。

值得一提的是,投身于更为具体的AI细分领域并大展身手,确实是当前AI人才在创业时较为集中的选择。例如,漆远选择了可信大型模型作为他的创业方向。离开蚂蚁集团副总裁职位后,漆远首先回归学术界,在复旦大学担任教职,随后他又采取产学结合的方式,创立了专注于大型模型的公司——无限光年。

在此之前,量子位从市场上了解到更多的信息如下:

阿里大模型元老杨红霞的去向已正式公布她已

如有任何遗漏或错误的信息,欢迎在评论区留言指正并分享更多的行业信息。

参考链接:

注意:您未提供需要重写的具体内容,仅重写了“参考链接”部分。若需重写其他内容,请提供详细信息。

本文出自微信公众号:量子位(ID:QbitAI),作者:明敏

(注:原文提供的信息已经很简洁明确,此处未做过多改动)

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析