当前位置:主页 > 派+学院 >

ChatGPT「能」与「不能」(科研版)

 



在短短几个月的时间里,人工智能(AI)程序ChatGPT已经成为一种文化轰动。在对话框输入题目,它能迅速完成一篇结构完整的学术论文。

似乎人工智能比我们聪明,也能完美处理正在做的工作,我们是不是要被替换?巨大兴趣后,随之而来的是恐惧与惊慌。

但是等等,先别慌,我还没跑完的模拟能不能代我跑啊,答案显然是不能。

AI终究抵不过人类的创造性,比如对分子模拟技术的反思、对新兴概念诸如元动力学的理解,还需要交给人类大脑,去用漫长的时间,换取一瞬间闪光的思考。

机器发挥着重要的作用,但只是作为提出假设、设计实验和理解结果的人的工具。最终,论文成果必须来自于我们头脑中那台奇妙的“计算机”,并由它来表达。

ChatGPT在某种程度上不是学术创作者而是一位“学术裁缝”。以上是派某的一些浅思,拉回正题。首先,来简单认识一下它:

ChatGPT是OpenAI开发的语言模型。它是一种机器学习模型,已经在人类语言的大数据集上进行了训练,允许其生成类人文本。

可用于语言翻译、文本摘要、问答等多种自然语言处理任务。目前的ChatGPT是基于GPT3打造的,在接下来几个月,将发布GPT4,又将是巨大的升级。

其亮点包括:全面免费开发,用户只需输入文字,就可免费调用完成各种事情(如数学计算、debug、写信等);

新增代码理解和生成能力,彰显技术实力的同时也拓宽了应用场景;

加入道德原则。RLHF训练方式使ChatGPT能够识别恶意信息,识别后拒绝给出有效回答;支持连续对话等等。

下图说明chatGPT工作原理(图源:CSDN@miukoo)

那么,ChatGPT究竟能在科研方面能做些什么呢?2023年1月31日,美国天普大学计算生物学中心Abhishek Thakur与密歇根州立大学化学系Gaurav Sharma共同发表在《ChemRxiv》上研究论文。

 

他们聚焦药物发现领域,探讨了Chat GPT在药物发现中的「能」与「不能」。

药物发现是发现和开发新药物治疗疾病的过程。它是一个复杂的多学科领域,涉及靶点识别、先导物发现、临床前开发、临床试验和监管审批等多个步骤。其基本流程如图1所示:

计算化学药物发现是应用基于计算机的方法来辅助发现新的药物。它涉及使用计算机模拟和建模技术来预测潜在药物分子的性质和相互作用。

这些方法可用于了解蛋白质和其他生物靶标的结构和行为,设计和优化能够与这些靶标结合并调节其活性的新化合物。

为了研究Chat GPT,研究人员设计了可应用于计算药物发现过程的计算问题:

1、计算化合物的多重性:当询问Zn的多重性时,Chat GPT给出了正确答案。Chat GPT的答案如下:锌是原子序数为30的过渡金属,在其电子构型中有30个电子。

 

2、生成Gaussian和其他软件的输入文件:Chat GPT成功生成高斯软件的输入文件。输入文件如图2所示。

3、AutoDock对接的输入文件:ChatGPT成功给出了AutoDock软件的输入文件,并对其中提到的参数进行了说明。

4、查找pdb文件:在PDB搜索中也可以使用。例如,可以提供金属蛋白、与DNA结合的蛋白、刺突蛋白等的PDB ID。

ChatGPT在药物发现中的【能】

★识别和验证新的药物靶标:ChatGPT可以在科学文献数据集上微调,并用于生成给定疾病或生物靶标的最新研究摘要。可以帮助研究人员快速识别新的潜在靶点或更好地了解特定领域的研究现状。

★设计新药物:ChatGPT可以在已知类药分子的数据集上进行微调,用于生成具有相似性质的新化学结构。这可以帮助研究人员确定在临床前和临床研究中有更高成功机会的新先导化合物。

★优化药物性质:ChatGPT可用于预测新药的药代动力学和药效学,并支持化学库的虚拟筛选,用于早期药物发现。

★毒性评估:ChatGPT可以在毒性数据集上微调,并用于预测新药的潜在毒性作用。

★生成药物相关报告和论文:ChatGPT可以在药物相关论文数据集上进行微调,用于生成总结特定领域研究现状的报告和论文。

ChatGPT在药物发现中的【不能】

尽管它具有各种优点,但它不能进行广泛的科学计算,如计算RMSD、RMSF、PCA、聚类等。对于这些复合物的工作,需要经过训练和经验的人类参与。

通过提供一种经济高效的方式来处理大量数据并产生新的知识,ChatGPT可以辅助研究人员做出更明智的决策,从而显著加快和改进药物研发过程。

它只是众多用于药物发现的工具之一,并不能替代实验验证和临床试验。此外,它不能进行复杂的计算,如分子模拟和分析分子水平的研究。
—ChatGPT—

总而言之,ChatGPT是一个强大的语言模型,可以辅助药物发现领域的研究。通过处理和生成类人文本,可以帮助研究人员快速识别新的潜在靶点,更好地了解研究现状,设计新药,优化新药的药代动力学和药效学。

 

此外,除了药物发现领域,它在蛋白质界也大有作为,正如近期一家初创公司Profluent,首次利用深度学习语言模型合成了自然界不存在的全新蛋白质,极大加速蛋白质工程的研究。

科学家们采用类似ChatGPT的蛋白质工程深度学习语言模型——ProGen,首次实现了AI预测蛋白质的合成。这些蛋白质与已知的完全不同,相似度最低的甚至只有31.4%,但和天然蛋白一样有效。

ChatGPT的未来,让我们拭目以待。

 

 

 



推荐阅读

Copyright © 2004-2011 DEDECMS. 织梦科技 版权所有 备案号:

QQ客服 服务热线 微信客服 公众号

扫一扫,添加QQ客服

服务热线

扫一扫,添加微信客服

扫一扫,关注公众号