跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

在2024年的WAIC峰会上,"洞悉未来大模型:基础研究新里程"论坛圆满落幕,四大显著成果同期亮相。

编辑日期:2024年07月10日

7月4日,上海——2024年世界人工智能大会论坛上,"跨越界限:探究下一代大模型基础研究"专题论坛汇聚了国内外杰出的院士和学者,共同深入讨论"AI for Science 的基础设施构建"和"通用人工智能的未来方法"两大尖端议题。该论坛由世界人工智能大会组委会办公室主办,上海算法创新研究院与北京科学智能研究院联合承办,并得到上海市人工智能行业协会的支持。论坛旨在促进下一代人工智能技术的交流与合作,强化基础设施建设,激发创新潜力。

众多国内外院士和行业专家出席了会议,参与讨论并分享见解。此外,论坛还特别安排了两场圆桌对话,以激发思想碰撞。会上,四个重大成果和产品的发布展示了技术创新的动态与趋势。

随着AI for Science在材料科学、生命科学和能源化工等领域的应用日益广泛,我们预见了其广阔的应用前景。然而,AI for Science的意义远不止于单点突破,它正在系统性地推动科研基础设施的进步,引领我们进入"平台化科研"的新时代。

论坛开场,中国科学院院士鄂维南发表了主旨演讲。他详细剖析了AI for Science当前的发展阶段,强调了构建相应基础设施的重要性。鄂院士提出了"四梁N柱"的概念,指出无论是哪个科研领域,都需要基本理论、实验、文献和计算能力作为支撑。因此,建立一个通用的科研基础平台,包括模型算法与软件、数据库与知识库、高效精确的实验方法和集成的计算能力平台,将有助于解决共性问题。AI方法显著增强了我们的科研实力,但仍需跨越"最后一公里"才能真正解决问题。

尽管当前人工智能技术和大型模型已取得显著进展,但要构建更坚实的人工智能基础,并发掘出一种更为可持续且能应对大规模能源消耗挑战的通用人工智能策略,我们仍需不断努力。迈向新一代通用人工智能的关键在于提升计算资源、数据资源、AI数据库功能、下一代模型以及人力资源。还有很多未被挖掘的人工智能潜力,需要结合具体应用场景,从应用层面到核心技术进行创新。令人鼓舞的是,行业已出现产品化和平台化的成功案例,本次论坛推出的四项产品就证明了这一发展趋势。

开放大原子模型(OpenLAM)

OpenLAM是“平台研究”和“开源共建”理念的典范。正如海量语言数据催生了大型语言模型,大量微观数据的积累也促成了创新的大原子模型。北京科学智能研究院院长、深势科技创始人张林峰指出,该模型的出现将极大地提升仿真设计的时空尺度和应用范围,使实验表征信号解析更准确,成为原子级别生产制造的核心部分。

2023年底,OpenLAM项目正式启动,由北京科学智能研究院携手DeepModeling开源社区及三十多家合作机构共同推进,并邀请了原子建模、表征、制造和AI行业的多位院士和专家担任顾问。秉持“全面覆盖、审慎评估、开放源码、即用即通”的原则,论坛上推出了涵盖合金、动态催化、分子反应、药物分子、固态电池、半导体和高温超导七个领域的模型解决方案,这些模型都源于开放社区的发展,并可在科学智能广场下载。由于实验科学家与AI技术和数据库之间的有效连接尚未建立,我们开发了“晶体造句”应用程序,期望实验科学家通过这款应用发现并合成更多未被充分探索的新材料。

在2024年的WAIC峰会上,"预见未来"的议题中,Science Navigator 1.0:一个创新的科研文献开放平台揭开帷幕。随着AI for Science领域基础设施的不断发展,Science Navigator 1.0作为一项突破性成果,旨在革新文献数据库和知识库的使用体验。面对跨学科搜索、原始内容追溯及科研数据解析等日益增长的需求,这个新一代平台凭借其强大的自然语言对话式检索功能,能快速准确地提供科研人员所需的信息,并确保答案源自文献原文。北京科学智能研究院副院长李鑫宇强调,通过AI向量数据库与大语言模型的结合,Science Navigator 1.0有效降低了训练和推理成本,实现了相当于3-6倍参数量模型的效果。它不仅是科研人员的理想工具,更是一个孕育新科研生态系统的平台。通过开放API接口,用户可以在此基础上构建定制化应用和智能系统,以适应科研的个性化需求,从而将更多时间和精力专注于核心问题的解决和创新思考。

关于未来通用人工智能模型的探讨,论坛专家提出了层次记忆模型的概念,该模型模拟人脑的记忆和思维过程。目前,这一先进模型已在沪上的算法创新研究院得以实现。

在上海算法创新研究院大模型中心的会议上,熊飞宇主任揭示了一项突破性的科研成就——忆³模型(Memory³)。该模型独具匠心地整合了显性记忆功能,显著提升了效能,同时降低了训练和推断的成本。忆³在原有的隐性记忆(模型参数)和工作记忆(上下文键值)基础上,开创性地添加了显性记忆这一新维度。模型能直接将文本转化为显性记忆,在推理过程中实现快速且稀疏的调用。借助外部化的知识存储,显性记忆减轻了模型参数的压力,从而提升了参数效率和训练效率,使得忆³在基准测试中展现出相当于三倍参数量模型的性能。基于忆³架构的AI搜索引擎,凭借显性记忆的高速读写,增强了答案的即时性、准确性和完整性,还能依据用户反馈实时优化。同时,隐性记忆帮助搜索引擎理解复杂的语境,确保搜索结果更为精确和个性化。这款搜索引擎凭借忆³的特性,极大地改善了用户体验,也重新定义了信息检索的标准。忆³技术目前已成功应用于金融、媒体等多个行业。

MyScale AI 数据库应运而生,伴随着深度学习和大型模型驱动的AI技术飞速进步,对图像、视频、文本、语音等非结构化数据的处理需求与能力呈爆炸式增长。高维向量是这类数据的统一语义表示,但现有的向量数据库在通用数据管理和扩展性方面存在局限,难以满足大规模复杂AI应用的挑战。MyScale旨在解决这些问题,致力于成为AI时代的基石。

墨奇科技的联合创始人兼首席技术官汤林鹏阐述:“MyScale是全球首例专为大规模结构化与非结构化数据处理打造的AI数据库,能有效地存储和联合查询大量结构化、矢量及文本等多样化的异构数据,其整体性能超越国内外同类产品4到10倍。实践中,MyScale AI数据库作为大模型与大数据融合的统一基础平台,已在金融文档解析、科研文献智能问答、企业知识管理、工业/制造业智能化、零售业客户服务、人力资源智能化、法律服务智能化等多个领域为客户创造了显著价值,促进了大模型与场景数据集成的技术革新和应用实施。”

未来,源于当下的每一步探索。在拓展人工智能疆界的过程中,培育先进的通用AI策略和优化AI for Science的基础设施至关重要,它们将驱动科技进步,开启前所未有的创新可能。

活动将于7月4日至7月6日举行,主要论坛设在上海世博展览馆2号会议室,盛大启幕。

活动日期:2024年7月4日至7月7日!探索未来,尽在2024年WAIC峰会。

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析