创新创业者漆远首次透露其专注的领域:构建可信赖的大规模模型。他的企业无限光年已获得阿里巴巴的投资,详情不详。
编辑日期:2024年07月05日
深度融合连接主义与符号主义的理念,构成了复旦大学浩清特聘教授、上海科学智能研究院院长漆远对于实现人工智能通用性(AGI)的关键路径。值得注意的是,这里的“可信大模型”区别于传统的、关注安全和隐私的可信AI定义。在辞去蚂蚁集团副总裁职务后,漆远选择了回归学术界,并在复旦任教,同时创办了大模型企业无限光年,这家公司已获得多轮投资,投资者包括阿里云和启明创投等知名机构。无限光年的核心目标就是打造这种“可信大模型”。由于大型语言模型可能产生的内容无法有效控制或解释,这在专业领域中往往无法达到精确性、可靠性和逻辑严谨性的标准。为此,漆远的团队致力于在Transformer架构上整合知识图谱和神经符号计算技术,以增强模型的“可信度”。然而,漆远强调,这不是将现有的“可信AI”和热门的“大模型”技术简单叠加,而是一种创新的融合方法。
如何定义可信的大模型?简单概括,就是将大语言模型与符号推理相融合,以此消除幻觉现象,显著提升模型的可靠性。
据漆远所述,当前大模型面临的主要难题有三个方面,而他和他的无限光年团队专注于攻克第三个挑战,即解决大模型可能出现的幻觉和遗忘等缺陷。
他们的解决方案是融合深度学习的基础——联结主义,与符号主义相统一。
“如果把时间倒退回十几年,联结主义并不受欢迎。科技发展就像时尚潮流,不断轮回。”漆远阐述道,“我们如今所做的,并非让符号主义替代联结主义,而是寻求两者的融合共存。”
漆远阐述的观点基于这样的见解:
一方面,Transformer具备处理概率问题的能力,但由于其基本原理是预测下一个词汇,故在逻辑推理方面显得力不从心。
另一方面,传统的神经符号方法虽然在应对复杂的推理任务时可能受限,但却擅长处理小规模的命题逻辑问题。
因此,他提出融合两者的理念,创建“神经网络+逻辑推理”的新模式。这样,既能高效解决具有大量规则和复杂性的逻辑推理挑战,又能适应输入的不确定性,妥善处理规则冲突。
至此,漆远提出的可信大模型浮出水面,其核心是一个结合了符号学派推理能力和连接学派学习能力的神经符号系统。在架构上,它超越了单纯预测的限制,增加了深思熟虑的逻辑推理功能,这一概念借鉴自丹尼尔·卡内曼的《思考,快与慢》。
这一创新提升了生成式AI的信任度和准确性,减少了错误,增强了稳定性。由此,可信大模型带来了两大优势:一是提升精确度和可解释性,二是降低了与计算相关的成本。
对于无限光年的"灰盒大模型"策略,漆远进一步指出:
我不敢断言可信大模型是通往AGI的唯一道路,但它无疑是一条极其重要且关键的途径。我相信在未来的两年内,这条路径将变得至关重要,成为众人热议的话题。
无限光年坚定地选择在两大领域率先实施其先进技术——医疗和金融。在金融行业,公司携手顶级证券机构推出了人工智能投资研究助手。而在医疗行业,无限光年与国内领先的三甲医院联手,运用可信技术革新构建医疗领域的大模型,显著提高了医生解读体检报告的速度和准确性。据内部消息,这两个专业领域的模型都是“精深大模型”,其参数量处于百亿至千亿之间。
让我们深入了解漆远的经历吧。
漆远在华中科技大学完成了自动控制专业的本科教育,随后在中国科学院攻读模式识别并获得硕士学位。他在MIT的媒体实验室从事机器学习研究,成功获取博士学位,并继续进行了博士后研究。
自1995年起,他便涉足AI领域,而他的MIT毕业论文则聚焦于机器学习中的贝叶斯推理和概率图模型。
秉持着“自动控制、模式识别和机器学习皆为AI子领域”的观念,漆远的本科、硕士到博士阶段的研究始终紧密围绕着AI展开。
在MIT工作期间,谷歌和Facebook都对这位学者抛出了邀请,但他最终决定坚守学术道路,之后转赴普渡大学,成为计算机科学与统计学的助理教授,并于2013年获得了副教授的终身职位。仅仅一年后,他选择回国加入阿里巴巴集团。
在阿里巴巴,他与涂子沛、金榕等共同创建了阿里巴巴达摩院的雏形——iDST,领导中国研究团队。他不仅主导构建了阿里巴巴首个大规模分布式机器学习平台PAI,还亲手打造了公司内部首个专业基于深度学习的语音识别团队。
随后,他在蚂蚁金服晋升为副总裁及首席数据科学家,同时负责达摩院的金融智能领域,以及担任蚂蚁AI的首席科学家等重要职务。
2021年,漆远回归学术界,成为复旦大学的一员。
目前,他在复旦担任浩清特聘教授、博士生导师以及人工智能创新与产业研究院的院长,并且是无限光年公司的创始人。据公开信息,无限光年的团队汇聚了来自阿里巴巴、蚂蚁集团、字节跳动、微软等全球知名企业的顶级AI专家,以及具有丰富经验的金融界人士,如摩根大通,和医疗领域的专业人士,如协和医院。
最近,漆远携带着“可信大模型”的理念出席了WAIC会议,对这一主题进行了深入讨论。他一如既往地充满信心:
2014年,我踏入阿里,不顾质疑推动了拥有两亿参数的大模型训练,使参数量增长了数百倍;之后在蚂蚁集团,我投身于可信AI的研发,那时国内对此尚处于起步阶段。
过去两次,我都在不被看好的情况下做出了正确的选择,我相信可信大模型也将如此。
已获得启迪资本的投资支持。
以上全文,欢迎继续阅读学习