蛋白动力学模拟
CADD干货篇|小白必备
本文将展示如何在没有本地Linux 系统的 情况下使用完全开源的工具做一个蛋白小分子的动力学模拟。该方法是可以达到100ns+ 每天的速度的(根据蛋白大小不同,速度大约介于90~200ns每天),无需购买任何硬件,也无需租用任何第三方GPU供应商。
AmberTools将被用来生成输入文件,OpenMM 将被用来运行模拟,模拟平台为在线百度AI Stuio, 并使用GPU加速。
01
模拟背景
药物设计中分子对接与动力学结合的流程图
随着对生物大分子的深入研究,靶点蛋白与小分子配体的相互作用,已经从传统认识上的“钥匙和锁”机制,转变成一种“手和手套”的诱导匹配(induce-fit)机制。这是因为科学家们逐渐认识到,蛋白质和配体的柔性使它们在相互结合时会寻求最吻合、能量最低的构象。
因此分子动力学在计算机辅助药物设计中的用途主要有三点︰
优化蛋白结构
一方面,优化同源建模技术得到的蛋白质结构,蛋白质同源建模通常都基于特定的算法与数据库的搜索,对于非保守区域的氨基酸,其结构往往有较高的随机性,准确度不够,因此需要基于分子力场的动力学模拟技术予以结构优化;另一方面,需要搜索蛋白质受体的构象空间,为分子对接提供多个有代表性的蛋白构象。
验证筛选结果,提高命中率
由于分子对接和药效团等虚拟筛选方法,受限于筛选速度,准确率不高,因此一般需要从筛选出的前50或100个小分子化合物中,作进一步地筛选。方法一般是先利用动力学模拟优化对接后的蛋白、配体复合物,验证蛋白与筛选出的小分子配体的结合情况;利用各种方法计算蛋白与配体的结合自由能,找出结合能最大的小分子,从而进一步筛选小分子化合物。
预测药物与靶标蛋白的结合机理
在已知一些实验现象的情况下,如钾离子通道的选择通透性对于神经传导有非常重要的意义,需要进一步研究为什么钾离子通道会只选择透过钾离子,而排斥其它离子,这时最合适的方法就是应用分子动力学模拟,从微观结构上去阐述它的机理。同样地,对于一些靶标蛋白或DNA,如果从理论上明白了它的结合机理,就可以为药物设计和寻找新药提供直接线索。
02
模拟过程
第一步:
H++ web server ,输入蛋白编码,预处理蛋白,下载后缀为 crd和top 两个文件备用
第二步:
在线(AI Studio)使用conda安装一个独立的python3.9 环境,取名AmberTools (可能需要重启命令终端) ,如有询问y/n,输入y。
需提前注册一个百度AI studio平台的账号,新建一个"项目",点击"启动环境",一台性能不错的虚拟机就建好了。
第三步:
激活python环境, 并安装AmberTools21,如有询问y/n,输入y (注意,如果你是用本地计算机需要用conda activate 但是在百度的平台我们需要用sourcre activate)。
运行AmberTools 所包含的一些列工具处理小分子,合并小分子和蛋白,生成新的crd和top文件。
第四步:
Windows本地电脑安装Anaconda,然后启动Anaconda命令行,输入(与第3步类似),并安装一个用于准备OpenMM动力学输入文件的图形界面工具,如有询问y/n,输入y。
第五步:
启动openmm-setup图形界面,你的默认浏览器将会自动弹出成为一个动力学准备软件界面, 输入openmm-setup,回车即可。
第六步:
回到百度AI Stuido, 在公开项目中搜索”OpenMM-蛋白-小分子动力学模拟“项目,fork到你自己的账号中,点击,”运行一下“。上传第5步生成的输入文件,开始模拟。
第七步:
下载模拟生成的output.pdb或者output.dcd到本地计算机,使用VMD进行分析
03
研究展望
随着生命科学理论和计算分析方法的快速发展,药物研发已经进入一个全新的时期,计算机辅助药物设计正是其中的领头技术,通过虚拟筛选潜在的药物小分子,可以大大降低新药研发的成本。
分子动力学(Molecular dynamics, MD)模拟作为计算生物学的一个分支,为研究蛋白质动力学行为、蛋白质动态相互作用和生物网络分析提供了新视角、新途径,可以从更微观的角度(分子水平)研究药物靶点蛋白的结构和其它各种性质,实现高效准确的虚拟筛选。