nqkk58 发表于 2024-10-10 07:08:18

J. Chem. Inf. Model. | 人工智能加强多物种肝脏微粒体稳定性预测


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">今天给<span style="color: black;">大众</span>介绍一篇由中南大学湘雅药学院曹东升教授团队在Journal of Chemical Information and Modeling近期<span style="color: black;">发布</span>的关于肝微粒体稳定性性质预测模型的<span style="color: black;">文案</span>《Enhancing Multi-species Liver Microsomal Stability Prediction through Artificial Intelligence》。该文献<span style="color: black;">经过</span>整合多个数据库的数据,构建了一个庞大的多物种肝微粒体稳定性数据集,并利用<span style="color: black;">设备</span>学习算法构建了106个共识模型。<span style="color: black;">经过</span>SHAP<span style="color: black;">办法</span>和原子热图分析,揭示了影响肝微粒体稳定性的重要特征。<span style="color: black;">科研</span>还应用MMPA<span style="color: black;">办法</span>和亚结构衍生算法,提取了与肝微粒体稳定性<span style="color: black;">关联</span>的分子转化规则。这项<span style="color: black;">科研</span>为<span style="color: black;">药品</span><span style="color: black;">开发</span><span style="color: black;">行业</span><span style="color: black;">供给</span>了新预测模型和分子解释,为<span style="color: black;">药品</span>设计和筛选<span style="color: black;">供给</span>了重要的<span style="color: black;">指点</span>和支持。</p><img src="https://mmbiz.qpic.cn/sz_mmbiz_png/P4UadRgibwicZzaBM7AcicjNsTJJ5HOW0oyGpnjhQyloMwiaj1gtApcytS1ZJdlmibFXhPstiaAiaiaE0tQOkhKpqYOZ8Q/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">引言</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在当今<span style="color: black;">药品</span><span style="color: black;">开发</span><span style="color: black;">行业</span>,准确<span style="color: black;">评定</span><span style="color: black;">药品</span>在<span style="color: black;">区别</span>物种中的肝微粒体稳定性<span style="color: black;">针对</span><span style="color: black;">药品</span>代谢和毒性<span style="color: black;">评定</span>至关重要。肝微粒体是肝细胞内质网膜上的小囊泡,承载着大部分<span style="color: black;">药品</span>代谢过程中的关键酶系统,如细胞色素P450酶。<span style="color: black;">认识</span><span style="color: black;">药品</span>在肝微粒体中的稳定性<span style="color: black;">能够</span><span style="color: black;">帮忙</span>预测<span style="color: black;">药品</span>的代谢速率和生物利用度,从而<span style="color: black;">指点</span><span style="color: black;">药品</span><span style="color: black;">开发</span>的方向和策略。然而,传统的实验<span style="color: black;">办法</span>耗时耗力,且成本<span style="color: black;">昂贵</span>,限制了大规模<span style="color: black;">药品</span>筛选和<span style="color: black;">评定</span>的效率。<span style="color: black;">因此呢</span>,利用计算机辅助预测模型<span style="color: black;">作为</span>一种重要的<span style="color: black;">处理</span><span style="color: black;">方法</span>。过去的<span style="color: black;">科研</span><span style="color: black;">显示</span>,基于<span style="color: black;">设备</span>学习和人工智能的肝微粒体稳定性预测模型在<span style="color: black;">药品</span><span style="color: black;">开发</span>中<span style="color: black;">拥有</span>潜在的应用前景。这些模型<span style="color: black;">能够</span>快速准确地<span style="color: black;">评定</span><span style="color: black;">海量</span>化合物的代谢稳定性,为<span style="color: black;">药品</span>设计和筛选<span style="color: black;">供给</span>重要参考。然而,现有的肝微粒体稳定性预测模型<span style="color: black;">常常</span>受限于单一物种或特定数据类型的依赖,<span style="color: black;">同期</span>缺乏跨物种比较和<span style="color: black;">实质</span>的模型解释。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此呢</span>,该<span style="color: black;">科研</span>旨在构建适用于人类、大鼠和小鼠的多物种肝微粒体稳定性预测模型,并<span style="color: black;">供给</span>全面的解释和分析。<span style="color: black;">经过</span>整合多个<span style="color: black;">表率</span>性数据库的数据,构建庞大且可公开<span style="color: black;">拜访</span>的数据集,结合<span style="color: black;">区别</span>的分子表征方式和<span style="color: black;">设备</span>学习算法,<span style="color: black;">科研</span>者们致力于<span style="color: black;">加强</span>预测模型的性能和泛化能力,<span style="color: black;">期盼</span>为<span style="color: black;">药品</span><span style="color: black;">开发</span><span style="color: black;">行业</span><span style="color: black;">供给</span>更准确、<span style="color: black;">有效</span>的肝微粒体稳定性<span style="color: black;">评定</span>工具,推动新药的<span style="color: black;">发掘</span>和<span style="color: black;">研发</span>。工作的整体工作流程如图1所示。</p><img src="https://mmbiz.qpic.cn/sz_mmbiz_png/P4UadRgibwicZzaBM7AcicjNsTJJ5HOW0oyuhqWsh5lO4SnFpY6r8kPLjlAaCtxzE7eLRRSMsq3omMXPYtYGp3CNg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">图1. 工作流程</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">材料与<span style="color: black;">办法</span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">首要</span>,<span style="color: black;">科研</span>者<span style="color: black;">经过</span>广泛搜索代谢<span style="color: black;">关联</span>分子信息,从多个数据源中收集了肝微粒体稳定性的多物种数据,<span style="color: black;">包含</span>人类、大鼠和小鼠。随后,对这些数据进行多<span style="color: black;">过程</span>的预处理,<span style="color: black;">包含</span>去除无结构信息的化合物、标准化处理、消除重复标签等。最后,创建了一个<span style="color: black;">包含</span><span style="color: black;">区别</span>物种数据的庞大数据集,<span style="color: black;">包含</span>15,344个人类数据、9,601个大鼠数据和1,978个小鼠数据。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在分子表征方面,<span style="color: black;">科研</span>者<span style="color: black;">运用</span>了分子图以及多种描述符,<span style="color: black;">包含</span>MOE2d、CATS、MACCS等描述符的计算。在模型构建与超参数优化<span style="color: black;">周期</span>,<span style="color: black;">她们</span><span style="color: black;">运用</span>了8种<span style="color: black;">设备</span>学习算法构建肝微粒体稳定性预测模型,<span style="color: black;">包含</span>传统的随机森林、XGBoost、支持向量机和梯度<span style="color: black;">提高</span>树等算法,以及基于图的深度学习算法如图卷积网络、图<span style="color: black;">重视</span>力网络等。针对<span style="color: black;">区别</span>算法,采用了<span style="color: black;">区别</span>的超参数优化<span style="color: black;">办法</span>,如蛮力<span style="color: black;">办法</span>和Parzen估计器树(TPE)<span style="color: black;">办法</span>,以<span style="color: black;">加强</span>模型性能。最后,<span style="color: black;">经过</span>验证集<span style="color: black;">评定</span>训练模型的性能,并进行<span style="color: black;">外边</span>测试集的比较,以验证模型的准确性和适用性。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">结果与讨论</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">模型结果</p><img src="https://mmbiz.qpic.cn/sz_mmbiz_png/P4UadRgibwicZzaBM7AcicjNsTJJ5HOW0oyGlc3TyXD5vKMfD39icicSvUouQ1wOibmGKFMn3OsoenO5uN6BicESHu5Yw/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">表1. 肝微粒体稳定性模型在人类、大鼠和小鼠物种测试集上的表现</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">科研</span>者基于<span style="color: black;">区别</span>的分子表征方式和<span style="color: black;">设备</span>学习算法,在3个物种上<span style="color: black;">创立</span>了一共108个肝微粒体稳定性<span style="color: black;">归类</span>模型。模型结果如表1所示,与基于图的模型相比,基于描述符的模型<span style="color: black;">拥有</span>更高的预测性能。在HLM模型中,结合XGBoost算法和FCFP4指纹的模型表现出了最好的性能,测试集的AUC值为0.893,MCC值为0.616。RLM模型中, XGBoost算法和MOE2d描述符的组合性能最佳,在测试集上的MCC值为0.603。<span style="color: black;">同期</span>,结合XGBoost算法和FCFP4指纹的MLM模型性能最佳,在测试集上的MCC值为0.574。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">经过</span>结合已有的算法和描述符,<span style="color: black;">科研</span>者们还构建了106个共识模型。共识模型的结果<span style="color: black;">显示</span>,共识模型始终优于基于单个描述符集或单个算法构建的模型。当<span style="color: black;">运用</span>相同的算法并适当组合<span style="color: black;">区别</span>的描述符时,肝微粒体稳定性共识模型的预测能力<span style="color: black;">能够</span>进一步<span style="color: black;">加强</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">与其他过滤规则和模型的比较</p><img src="https://mmbiz.qpic.cn/sz_mmbiz_png/P4UadRgibwicZzaBM7AcicjNsTJJ5HOW0oyz04nIQzAEsU0rN3ACDqt8lC2keWbORfxgKInO3uHDjUt3tp7GkosPg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">表2. 多物种肝微粒体稳定性模型与其他平台肝微粒体稳定性模型的性能比较</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">科研</span>者们利用额外收集的多物种肝微粒体数据<span style="color: black;">做为</span>公平比较的<span style="color: black;">外边</span>测试集。如表2所示,<span style="color: black;">科研</span>者们将<span style="color: black;">创立</span>的最佳共识模型与现有的肝微粒体稳定性预测模型(如ADME@ NCATS和vNN-ADMET)进行了比较。结果<span style="color: black;">显示</span>,<span style="color: black;">科研</span>者构建的肝微粒体稳定性模型在各自物种数据集上预测性能最好,对人类、大鼠和小鼠的预测ACC值分别为0.757、0.804和0.763。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">模型解释</p><img src="https://mmbiz.qpic.cn/sz_mmbiz_png/P4UadRgibwicZzaBM7AcicjNsTJJ5HOW0oySzhdZLMTTQBsAdbWwW96jFmCY9cZOeRQlP4qva3k3n37iaEuVVlO3Jg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">图2. HLM模型中最重要的10个分子描述符及其对应的SHAP值:(A) MOE2d描述符。(B) ECFP4指纹图谱。(C) FCFP4指纹图谱。(D) RDKit指纹图谱。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">科研</span>者<span style="color: black;">选取</span>了SHAP<span style="color: black;">办法</span>对<span style="color: black;">区别</span>物种构建的部分模型进行了整体的解释分析,结果如图2所示。SHAP<span style="color: black;">办法</span>基于Shapley值理论,<span style="color: black;">经过</span>量化<span style="color: black;">每一个</span>特征对整体预测的贡献,<span style="color: black;">能够</span>深入<span style="color: black;">认识</span><span style="color: black;">每一个</span>样本的预测结果。除<span style="color: black;">认识</span>释<span style="color: black;">每一个</span>物种对应的肝微粒体稳定性模型外,<span style="color: black;">科研</span>者还比较了多物种模型,用来表现物种间差异性对构建模型的影响。</p><img src="https://mmbiz.qpic.cn/sz_mmbiz_png/P4UadRgibwicZzaBM7AcicjNsTJJ5HOW0oyv7UxIibtOWgWDPAudum3un5NTRicuDg5cWianOhHia3NS7CA37GyD71RMg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">图3. 基于Attentive FP模型解释机制的原子热图和影响HLM条目中 (A)假阳性化合物和(B)假阴性化合物的结果输出的重要分子描述符分布图</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为了更好地理解预测整体模型与<span style="color: black;">详细</span>预测之间的差异,<span style="color: black;">科研</span>者还<span style="color: black;">选取</span>了<span style="color: black;">有些</span>有<span style="color: black;">表率</span>性的分子,<span style="color: black;">运用</span>分子在模型输出<span style="color: black;">供给</span>的描述符SHAP值和Attentive FP算法的可解释层<span style="color: black;">供给</span>的原子热图进行展示,结果如图3所示。结果<span style="color: black;">显示</span>,<span style="color: black;">倘若</span>分子<span style="color: black;">无</span>正确地学习先前的模型分析范式<span style="color: black;">或</span>范式规则本身适用范围较小,<span style="color: black;">那样</span>在预测过程中可能会<span style="color: black;">引起</span>该分子被错误预测。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">数据解释</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">科研</span>者利用匹配分子对(MMPs)<span style="color: black;">办法</span>和先前<span style="color: black;">研发</span>的子结构生成算法,进一步揭示了分子亚结构转化与肝微粒体稳定性之间的关系,部分结果如表3、表4所示。<span style="color: black;">科研</span>者进行分析<span style="color: black;">发掘</span>,<span style="color: black;">有些</span><span style="color: black;">明显</span>的转化规律<span style="color: black;">包含</span>了单原子转化和多原子片段转化,子结构算法提取的<span style="color: black;">表率</span>性肝微粒体稳定性亚结构有效<span style="color: black;">弥补</span>了与先前模型解释<span style="color: black;">区别</span>的结构知识。<span style="color: black;">区别</span>的物种<span style="color: black;">拥有</span><span style="color: black;">区别</span>的<span style="color: black;">表率</span>性转化规则和亚结构,强调了构建肝微粒体的稳定性模型需要<span style="color: black;">注重</span>实验数据<span style="color: black;">源自</span>的物种差异性。</p><img src="https://mmbiz.qpic.cn/sz_mmbiz_png/P4UadRgibwicZzaBM7AcicjNsTJJ5HOW0oyUykQmQLzRcNiciasj1DuF1s6txzYCHSyc6WRyhSDmPhsqbkuFmWgnSNg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">表3. 影响人类肝微粒体分子稳定性的<span style="color: black;">表率</span>性匹配分子对化学转化</p><img src="https://mmbiz.qpic.cn/sz_mmbiz_png/P4UadRgibwicZzaBM7AcicjNsTJJ5HOW0oyO7ZshE6TWdsia83cFsDBbpdpicu68WXz4IJJDhDnlJZWWZHHaVwL8VFQ/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">表4. 影响人类肝微粒体分子稳定性的<span style="color: black;">表率</span>性亚结构</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">总结</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">科研</span>团队指出,<span style="color: black;">经过</span>构建多种肝微粒体稳定性预测模型,<span style="color: black;">包含</span>基于描述符和基于图的模型,能够有效预测人类、大鼠和小鼠三种<span style="color: black;">区别</span>物种的肝微粒体稳定性。基于图的深度学习算法在预测精度和泛化能力上表现优异,尤其是在<span style="color: black;">区别</span>物种中的预测效果较好。<span style="color: black;">经过</span>组合<span style="color: black;">区别</span>描述符和<span style="color: black;">设备</span>学习算法构建共识模型,进一步<span style="color: black;">加强</span>了模型的预测性能和泛化能力。<span style="color: black;">同期</span>,SHAP等解释<span style="color: black;">办法</span>在模型中的应用,为理解<span style="color: black;">区别</span>物种肝微粒体稳定性的差异性<span style="color: black;">供给</span>了新的视角,有助于优化<span style="color: black;">药品</span>设计和筛选过程,推动新药的<span style="color: black;">发掘</span>和<span style="color: black;">研发</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">参考资料</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Long, Teng-Zhi, De-Jun Jiang, Shao-Hua Shi, You-Chao Deng, Wen-Xuan Wang, and Dong-Sheng Cao. "Enhancing Multi-species Liver Microsomal Stability Prediction through Artificial Intelligence." Journal of Chemical Information and Modeling (2024).</p>




qzmjef 发表于 2024-10-10 17:40:45

我们有着相似的经历,你的感受我深有体会。

nqkk58 发表于 7 天前

楼主果然英明!不得不赞美你一下!
页: [1]
查看完整版本: J. Chem. Inf. Model. | 人工智能加强多物种肝脏微粒体稳定性预测