img

全文速览

本文是一篇关于计算机辅助药物设计(CADD)到人工智能药物设计(AIDD)的综述文章。文章首先介绍了CADD的起源和发展,强调了其在现代药物发现中的核心地位。随后,文章通过展示近年来AIDD的成功案例,详细描述了人工智能在药物发现中的演变过程,包括化学库筛选、连接子生成和从头分子生成三个阶段。文章还比较了CADD和AIDD的特点,并总结了AIDD在药物设计中的潜力和未来发展方向。

背景介绍

计算机辅助药物设计(CADD)起源于20世纪60年代,随着Hansch等人引入定量构效关系(QSAR)模型的概念而逐渐发展。到20世纪80年代,CADD已经成为药物研究中的强大工具,能够通过结构化和配体化方法预测分子结构与活性的关系,并与靶点相互作用。CADD主要分为基于结构的药物设计(SBDD)和基于配体的药物设计(LBDD),在药物发现的各个阶段都有广泛应用。然而,随着数据量的指数级增长,人工智能药物设计(AIDD)作为一种增强型的CADD迭代,在过去十年中蓬勃发展。AIDD在蛋白质折叠、性质预测和分子生成等方面展现出前所未有的机遇,并且能够加速药物发现过程,探索未知的化学空间。

图文解析

img

图1:CADD和AIDD的发展趋势。图1A:展示了CADD的发展历程。从20世纪60年代QSAR模型的引入,到20世纪70年代CADD概念的形成,再到20世纪80年代成为药物研究的成熟工具。AIDD在近年来随着数据量的增加和模型优化而迅速发展。图1B:展示了CADD和AIDD年度论文发表趋势。通过PubMed数据库检索关键词“(计算机辅助)和(药物设计)”以及“(人工智能)和(药物设计)”,可以看出AIDD近年来的关注度和研究热度逐渐超过CADD。

img

图2:CADD的主要流程和部分。详细展示了CADD的两个主要类别:基于结构的药物设计(SBDD)和基于配体的药物设计(LBDD)。SBDD需要利用目标蛋白的结构信息,包括确定目标结构和识别结合位点;而LBDD则不需要目标结构信息,主要依赖配体自身的结构信息。

img

图3:人工智能的分类及AIDD的一般流程。图3A:介绍了人工智能的三个主要分支:监督学习、无监督学习和强化学习。监督学习利用标记数据训练模型,无监督学习从无标记数据中提取特征,强化学习则通过奖励函数训练模型以实现特定目标。图3B:展示了AIDD的一般流程,包括数据收集、模型训练、分子生成和性质预测等步骤。

img

表1:基于CADD在2021-2023年期间成功发现的分子。列出了近年来通过CADD方法发现的分子,包括它们的结构、靶点、活性、发现方法和潜在应用。例如,化合物21通过计算机辅助模式分析发现,可用于治疗多药耐药性癌症。

img

表2:基于AIDD(预测模型)成功发现的分子。展示了通过AIDD预测模型发现的分子,包括它们的结构、靶点、活性和发现方法。例如,Halicin是通过深度神经网络模型发现的,具有抗菌活性。

img

表3:基于AIDD(生成模型)成功发现的分子。展示了通过AIDD生成模型发现的分子,包括它们的结构、靶点、活性和发现方法。例如,Compound 1是通过生成张量强化学习(GENTRL)模型发现的,具有抗纤维化活性。

img

图4:AIDD案例分析(Abaucin的发现)。详细描述了Abaucin的发现过程,包括数据收集、模型训练、分子筛选和实验验证。展示了如何通过机器学习模型从大量化合物中筛选出具有抗菌活性的分子。

img

图5:AIDD案例分析(PROTAC-RL模型)。展示了如何利用深度生成模型PROTAC-RL加速PROTAC设计。该模型通过生成连接两个已知配体的连接子,提高了药物发现的效率。

img

图6:AIDD案例分析(CogMol模型)。描述了CogMol模型的设计和应用,该模型基于深度生成模型,能够生成针对特定靶点的药物分子。展示了如何通过条件采样和预测器从潜在空间中生成具有所需性质的分子。

总结展望

文章总结了CADD和AIDD在药物设计中的演变和发展。CADD作为药物发现的成熟工具,已经在多个药物的发现中发挥了重要作用。AIDD作为CADD的增强版,通过利用人工智能技术,进一步提高了药物发现的效率和准确性。AIDD不仅能够预测分子性质和筛选化合物库,还能够生成全新的分子结构,探索更广泛的化学空间。尽管AIDD在药物设计中取得了显著进展,但仍面临数据质量和模型优化的挑战。未来,随着数据量的增加和模型的改进,AIDD有望在药物设计中发挥更大的作用,成为药物发现的主导趋势。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

openvela 操作系统专为 AIoT 领域量身定制,以轻量化、标准兼容、安全性和高度可扩展性为核心特点。openvela 以其卓越的技术优势,已成为众多物联网设备和 AI 硬件的技术首选,涵盖了智能手表、运动手环、智能音箱、耳机、智能家居设备以及机器人等多个领域。

更多推荐