跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

浙江大学和之江实验室的团队利用深度学习技术,在大规模药物发现和再利用方面取得了高达76.32%的识别精度。

编辑日期:2024年08月28日

浙江大学和之江实验室的团队利用深度学习技术

编辑 | 萝卜皮

大规模药物研发与再利用面临诸多挑战,其中确定作用机制(MOA)至关重要,但现有方法成本高且效率低下。

浙江大学、之江实验室及斯坦福大学的研究人员提出了一种通过分析线粒体表型变化来识别 MOA 的新方法。他们通过对线粒体形态和膜电位进行时间成像,建立了一个监测时间分辨线粒体图像的工作流程,获得了包含 570,096 张单细胞图像的数据集,这些图像涉及 1,068 种美国食品和药物管理局批准的药物。

研究团队开发了一种名为 MitoReID 的深度学习模型,该模型采用了重新识别(ReID)框架和 Inflated 3D ResNet 主干网络。MitoReID 提供了一种自动化且经济高效的目标识别方法,有望加速大规模药物发现与再利用。该研究成果以“Deep learning for large-scale drug discovery and repurposing”为题,于 2024 年 8 月 21 日发表在《Nature Computational Science》上。

浙江大学和之江实验室的团队利用深度学习技术

线粒体形态、膜电位和氧化还原状态已被用于识别功能性化合物或遗传扰动的影响,但过去的研究仅限于提取少量形态特征,导致大量有助于提高目标识别的信息被忽略。

为了克服这一局限,研究人员引入了时间维度,评估了不同作用机制化合物对线粒体形态和膜电位的影响。

具体而言,研究人员创建了一个包含 1,000 多种美国食品药品监督管理局(FDA)批准的药物处理的线粒体表型数据集,其中包括 16 个时间点的 570,096 张单细胞图像。由于传统机器学习技术在处理时间序列数据的复杂性方面存在局限性,因此难以有效区分线粒体表型及其作用机制(MOA)之间的关系。

为了解决这一问题,研究团队开发了一种基于线粒体分析的 MOA 识别方法,称为 MitoReID 的深度学习模型。通过结合大规模纵向线粒体动态监测和深度学习技术,研究人员成功建立了一种快速、自动化且无偏的方法来预测化学物质的 MOA。

深度学习识别 MOA 框架

MitoReID 框架由以下四个基本部分组成:

  1. 建立细胞损伤模型:研究人员首先构建了一个细胞损伤模型,并将其暴露于 1,068 种 FDA 批准的药物中,以观察应激反应。通过高通量方法,特别关注线粒体形态和膜电位的变化,收集时间序列图像作为原始数据集的基础。
  2. 训练深度学习模型:在重新识别(ReID)框架内,利用创新的深度学习模型 MitoReID 对这些时间序列图像进行训练。
  3. 特征提取与匹配:在训练完成后,使用该模型提取未见过的药物和天然化合物的特征,并通过余弦距离将这些特征与 FDA 批准药物的特征进行匹配。根据最接近的药物推断出预测的 MOA。
  4. 生化实验验证:最后,进行体外生化实验来验证未鉴定天然化合物的假设作用机制。

图示说明

浙江大学和之江实验室的团队利用深度学习技术

图示:通过分析时间线粒体表型,基于深度学习的 MOA 预测框架可用于大规模药物发现和重新利用。(来源:论文)

这一全面的概念框架提供了一种方法来观察细胞对各种 FDA 批准的化合物和天然物质的复杂应激反应,有望产生新的候选药物并揭示之前未知的作用机制,从而实现更高效和更准确的药物研发。

经过评估,该算法能够将 477 种 FDA 批准的药物准确分类为 38 种已知的机制(MOA),并成功识别出六种未知的 FDA 批准药物及数十种天然化合物的机制(MOA)。

浙江大学和之江实验室的团队利用深度学习技

图示:使用 MitoReID 根据时间线粒体表型将 477 种 FDA 批准的药物分为 38 种 MOA。(来源:论文)

该算法在测试集上实现了 76.32% 的 Rank-1 准确率和 65.92% 的平均精度,并成功根据线粒体表型识别了六种未经训练的药物的机制(MOA)。

此外,MitoReID 确定了茶中天然化合物表儿茶素的作用机制为环氧合酶 2 抑制,并在体外成功验证。

浙江大学和之江实验室的团队利用深度学习技

图示:高通量采集时间线粒体表型的延时图像。(来源:论文)

MitoReID 展现了预测未见过的药物和天然化合物机制(MOA)的潜力,这有助于基于细胞器表型相似性的大规模药物发现和再利用。

MitoReID 的一个显著优势在于其能捕捉全面的线粒体特征,超越了传统形态测量技术的能力。该模型自主学习并整合了线粒体形状和时间动态等全局特征,无需复杂的数据预处理、手动特征提取或特征选择。

此外,通过利用 GPU 计算,模型的效率得以提升,在处理大规模数据集时仍能实现快速预测。

局限性与未来方向

然而,必须承认 MitoReID 的性能会受到数据质量、实验条件和标签注释等因素的影响。

图像模糊和实验变异性会极大地影响预测的准确性,因此需要严格的数据质量控制措施。此外,准确标注时间线粒体表型仍是一个挑战,有必要进一步探索,为标注方法建立坚实的理论基础。

为了应对 MitoReID 面临的挑战并进一步提升其性能,研究人员建议将药物-靶点和药物-疾病关系等更多信息整合到深度学习方法中。图神经网络(GNN)为整合这类信息提供了一条有希望的途径。通过将这些宝贵的知识整合到 GNN 框架中,研究团队希望进一步增强 MitoReID 的性能,并提高其预测药物靶标和药物作用机制(MOA)的能力。此外,GNN 可以利用所有药物图像来克服当前药物作用机制(MOA)标记和分类的局限性。

目前,只有当药物具有完全相同的药物作用机制(MOA)时,才会将其划分为不同的类别,而忽略了某些药物可能具有重叠的药物作用机制(MOA)集这一事实。

GNN 可以克服这一限制,并根据共享的药物作用机制特征为药物创建更细致入微的分类框架。研究人员表示,下一步将致力于改进和扩展 MitoReID 的功能,这种现有知识与先进深度学习技术的整合将成为他们未来研究工作的重点。

浙江大学和之江实验室的团队利用深度学习技

此外,该团队的数据集具有巨大的潜力,可以识别对心血管系统和其他线粒体疾病产生积极或消极影响的药物。通过分析与特定疾病相关的药物表型特征,研究人员可以发现潜在的治疗候选药物或识别不良反应。

该数据集的全面性(结合 MitoReID 的强大功能)使研究人员能够研究药物诱导表型与疾病结果之间的复杂关系。这一研究方向对于发现治疗干预措施和优化治疗策略具有巨大的前景。

研究人员在论文中表示:“通过不断改进和扩展我们的方法,融入人类知识,并采用 GNN 等新兴技术,我们期待进一步取得突破,为开发更有效、更有针对性的治疗方法做出贡献。这种多学科方法弥合了计算分析和生物领域专业知识之间的差距,有助于推动药物发现的进步。”

论文链接:https://www.nature.com/articles/s43588-024-00679-4

(注意:原文本就是一个论文链接,重写时并未做改动,因为它本身已经是具体且明确的信息。如果需要其他形式的重写,请提供更多的上下文或要求。)

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析