[MMPBSA]深入解读 gmx_MMPBSA 计算结果:从焓、熵到残基分解的结构化解析

发布者: 站长-R 分类: IT技术交流,分子动力学模拟,生物信息 发布时间: 2026-05-25 16:35 访问量: 96 次浏览

在使用 gmx_MMPBSA 完成结合自由能计算后,gmx_MMPBSA_ana 会输出一个树形结构的结果汇总。该结构严格按照热力学函数的构成进行组织,涵盖了焓变(ΔH)、熵变贡献(-TΔS)、结合自由能(ΔG)以及基于残基的能量分解。本文我们将以一个同时包含 GB 和 PB 计算、并启用相互作用熵与残基分解的典型输入文件为例,逐一解释结果树中每一项的物理意义及其背后的理论依据。

我们将用如下的一个基础分享配置输入文件来讲解。

# =======================================================
# 综合 mmpbsa_gen.in 文件
# 包含:GB、PB、能量分解、丙氨酸扫描、相互作用熵
# 力场:蛋白质 ff14SB,小分子 GAFF
# gmx_MMPBSA v1.6.4
# =======================================================

# 通用部分
&general
  sys_name           = "Protein_Ligand"           # 系统名称(用于分析)
  startframe         = 9991                       # 起始帧
  endframe           = 10001                      # 结束帧
  interval           = 1                          # 取帧间隔(10帧取1,降低计算量)
  forcefields        = "leaprc.protein.ff14SB,leaprc.gaff"   # 力场:蛋白质ff14SB + 小分子GAFF
  PBRadii            = 3                          # PB半径集(3 = mbondi2,常用)
  temperature        = 298.15                     # 温度(K)
  verbose            = 2                          # 输出详细程度
  keep_files         = 1                          # 保留临时文件
  netcdf             = 1                          # 使用NetCDF加速
  interaction_entropy= 1                          # 开启相互作用熵
  ie_segment         = 25                         # 用最后25%的帧计算熵
/

# GB 计算
&gb
  igb                = 5                          # GB模型(5 = GB‑OBC2)
  saltcon            = 0.150                      # 盐浓度(M)
  intdiel            = 1.0                        # 溶质介电常数
  extdiel            = 78.5                       # 溶剂介电常数
  surften            = 0.0072                     # 表面张力(kcal/mol/Ų)
  probe              = 1.4                        # 探针半径(Å)
/

# PB 计算
&pb
  istrng             = 0.150                      # 盐浓度(M)
  fillratio          = 4.0                        # 网格填充比例
  radiopt            = 1                          # 使用Tan‑Luo半径
  inp                = 2                          # 非极性项分解(2 = 空腔+色散)
  cavity_surften      = 0.0378                     # 空腔表面张力
  cavity_offset      = -0.5692                    # 空腔偏移
  use_sav            = 1                          # 用体积计算空腔项
  decompopt          = 2                          # 非极性分解方案
  use_rmin           = 1                          # 用rmin半径
/

# 能量分解
&decomp
  idecomp            = 2                          # 2 = 残基分解(1‑4 EEL加到EEL,1‑4 VDW加到VDW)
  dec_verbose        = 1                          # 1 = 输出总贡献
  print_res          = "within 5"                 # 输出距离结合界面5 Å以内的残基
  csv_format         = 1                          # 输出CSV文件,方便画图
/

# 丙氨酸扫描(可以加入,在酶活改造领域至关重要,目前我们先不了解,后面我们单独详细介绍)
#&alanine_scanning
#  mutant             = "ALA"                      # 突变成丙氨酸
#  mutant_res         = "A:45"                     # 要突变的残基(链A,45号),需根据实际修改!!!!!!!!
#  mutant_only        = 0                          # 0 = 同时计算突变型和野生型
#  cas_intdiel        = 1                          # 根据残基极性自动调整介电常数
#  intdiel_nonpolar   = 1                          # 非极性残基介电常数
#  intdiel_polar      = 3                          # 极性残基介电常数
#  intdiel_positive   = 5                          # 正电残基介电常数
#  intdiel_negative   = 5                          # 负电残基介电常数
#/

1. 基本原理与计算框架

MMPBSA(Molecular Mechanics Poisson–Boltzmann Surface Area)和 MMGBSA(Generalized Born Surface Area)是基于连续介质模型的自由能计算方法。其核心假设是结合自由能可以分解为气相分子力学能量、溶剂化自由能以及熵贡献的统计平均值:

\Delta G_{\text{bind}} = \langle G_{\text{complex}} \rangle - \langle G_{\text{receptor}} \rangle - \langle G_{\text{ligand}} \rangle

其中各组分的自由能由下式给出:

G = E_{\text{MM}} + G_{\text{solv}} - TS

  • E_{\text{MM}} 为分子力学能量,包括成键项(键伸缩、角弯曲、二面角)和非键项(范德华、静电)。
  • G_{\text{solv}} 为溶剂化自由能,进一步分为极性部分(G_{\text{pol}})和非极性部分(G_{\text{nonpol}})。
  • S 为溶质构型熵,通常通过正则模分析或准谐波分析获得,在 gmx_MMPBSA 中也可使用相互作用熵(Interaction Entropy, IE)近似。

由于成键项在单点能计算中几乎不变,其对结合能的净贡献(Δ)接近于零,因此最终关注的能量项主要来自非键相互作用与溶剂化效应的差值。

1.1溶剂化自由能的极性部分:PB 模型与 GB 模型

在 MMPBSA/MMGBSA 的框架中,溶剂化自由能 G_{\text{solv}} 被拆分为极性 G_{\text{pol}} 与非极性 G_{\text{nonpol}} 两部分。其中,非极性项通常正比于溶剂可及表面积(SASA),用于描述溶质-溶剂间的疏水与范德华相互作用;而极性项则源于溶质分子与极性溶剂(水)之间的静电相互作用——这一项的计算正是 PB 与 GB 模型的核心区别所在。

Poisson–Boltzmann(PB)模型是一种基于连续介质电静力学理论的严格方法。它将溶剂视为具有均匀介电常数(通常设为 80 左右)的连续介质,而溶质内部则采用较低的介电常数(常取 2–4)。在给定溶质原子电荷分布的情况下,静电势 \phi(\mathbf{r}) 满足 Poisson 方程:

\nabla \cdot [\varepsilon(\mathbf{r}) \nabla \phi(\mathbf{r})] = -4\pi \rho(\mathbf{r})

若溶液中存在可移动的离子(如生理盐环境),则需引入 Boltzmann 分布来描述离子云的空间分布,此时方程变为非线性 Poisson–Boltzmann 方程:

\nabla \cdot [\varepsilon(\mathbf{r}) \nabla \phi(\mathbf{r})] - \bar{\kappa}^2 \sinh\left(\frac{e\phi}{k_B T}\right) = -4\pi \rho(\mathbf{r})

其中 \bar{\kappa} 为修正的德拜屏蔽参数。通过数值求解(有限差分或有限元法),可获得溶质周围完整的电势分布,进而计算出将溶质从真空“充入”连续溶剂所需的极性溶剂化自由能:

G_{\text{pol}}^{\text{PB}} = \frac{1}{2} \sum_i q_i \left[ \phi(\mathbf{r}_i) - \phi_{\text{vac}}(\mathbf{r}_i) \right]

PB 模型的优势在于严格处理分子形状、电荷分布以及离子屏蔽效应,尤其适用于高度带电或形状不规则的大分子体系。然而,其数值求解的计算代价较高,限制了在高通量或长时程采样中的应用。

Generalized Born(GB)模型则是一种近似但高效的替代方案。它基于 Born 离子溶剂化自由能的经典公式推广而来:对于任意形状的分子,第 i 个原子的极性溶剂化自由能可写为:

G_{\text{pol, i}}^{\text{GB}} = -\frac{1}{2}\left(1 - \frac{1}{\varepsilon_w}\right) \frac{q_i^2}{a_i}

其中 a_i 为 Born 半径,代表该原子到分子表面的有效电介质距离。当体系中存在多个原子时,必须考虑相互屏蔽效应,因此总极性项通过成对求和近似得到:

G_{\text{pol}}^{\text{GB}} \approx -\frac{1}{2}\left(1 - \frac{1}{\varepsilon_w}\right) \sum_{i,j} \frac{q_i q_j}{f_{ij}^{\text{GB}}(r_{ij}, a_i, a_j)}

f_{ij}^{\text{GB}} 是一个经验函数(如 Still、HCT、OBC 等不同形式),当 r_{ij} 较大时退化为库仑相互作用(被溶剂介电常数屏蔽),当 r_{ij} 很小时则趋近于 Born 极限。GB 模型不需要求解三维偏微分方程,而是通过解析近似快速估算每个原子的有效 Born 半径,再累加得到总极性溶剂化能。常见的 GB 变体(如 GB-OBC、GB-neck2)通过经验参数修正,能在许多体系中与 PB 结果达到良好的一致性(偏差通常小于 1–2 kcal/mol),而计算速度却快 1–2 个数量级。

PB 与 GB 的权衡:在实际的 MMPBSA/MMGBSA 计算中,选择 PB 还是 GB 取决于精度与效率的平衡。PB 严格物理,适合精细研究(如电荷突变、离子强度影响);GB 计算廉价,适合大规模采样或作为力场再加权的一部分。值得注意的是,无论是 PB 还是 GB,其计算的都是静电溶剂化自由能,而最终的结合自由能还需要与气相分子力学非键项 \Delta E_{\text{vdw}} + \Delta E_{\text{elec}} 协同考虑——因为溶剂化能中的极性部分天然地补偿了气相静电相互作用的高估。这种“气相静电 + 极性溶剂化”的配对构成了连续介质模型中经典的“库仑 + Born”机制,也是理解结合自由能热力学来源的关键视角。


2. Enthalpy (ΔH) 部分:气相与溶剂化能量的分解

结果树中 Enthalpy 标题下展开的 Normal 子项,代表标准未突变的焓计算。此处同时列出 GB 和 PB 两套结果,二者仅在溶剂化模型上存在差异。

2.1 Complex、Receptor、Ligand 下的能量项

对于每一帧轨迹,程序分别计算复合物、受体和配体的单点能量,并在每个组分下列出相同的能量项。以 GB 下的 Complex 为例:

  • BOND:键伸缩能。从力场参数计算,因坐标冻结成键项基本恒定。
  • ANGLE:角弯曲能。同样几乎不变。
  • DIHED:二面角扭转能。贡献极小且几乎在差分中抵消。
  • VDWAALS:范德华相互作用能,由 Lennard-Jones 势描述。反映原子间的色散与交换排斥,通常为负值(有利),是结合焓的主要来源之一。
  • EEL:真空静电相互作用能(库仑势)。在介电常数为 1 的真空中计算,数值往往很大。
  • 1-4 VDW1-4 EEL:1-4 非键相互作用,即被共价键间隔三个键的原子对之间的范德华和静电作用。力场中这些项的缩放因子通常小于 1,其贡献单独列出,并在 Delta 中抵消或调整。
  • EGB:广义 Born 模型计算的极性溶剂化自由能。该能量反映了溶质电荷分布在溶剂中引起的反应场能量,是补偿真空静电作用的关键项。输入文件中 igb=5 表示采用 GB-OBC2 模型,intdiel=1.0extdiel=78.5 分别定义了溶质内部与溶剂的介电常数。
  • ESURF:非极性溶剂化自由能。通过溶剂可及表面积(SASA)乘以表面张力常数计算,此处 surften=0.0072 kcal/mol/Ų。非极性溶剂化项主要模拟空穴形成能与溶质-溶剂色散作用,通常为负,对疏水结合有重要贡献。
  • GGAS:气相总能量,定义为 VDWAALS + EEL(有时也包括 1-4 项,取决于分解设置),表示除去溶剂效应的分子内与分子间非键能。
  • GSOLV:溶剂化总自由能,即 EGB + ESURF(PB 下为 EPB + ENPOLAR)。
  • TOTAL:该组分在溶剂中的总势能,即 GGAS + GSOLV(或包含成键项后的总和)。此值并非结合焓,需进一步求差。

请添加图片描述
请添加图片描述

对于 PB 模型,上述 EGB 被替换为 EPB(Poisson–Boltzmann 静电能),ESURF 可能被更精细的非极性项(如空穴项与色散项)取代。我们上面的输入文件中 inp=2 指定了非极性项包含空穴与色散贡献,同时 cavity_surftencavity_offset 控制空穴项计算。PB 通常被认为比 GB 更精确,但计算量更大。

2.2 Delta:结合引起的各项能量变化

Delta 分组下的每一项数值,均由 Complex - (Receptor + Ligand) 计算得到。例如:

  • ΔVDWAALS:复合物形成时范德华相互作用的变化。负值表示结合后受体与配体间的范德华接触增强,是结合焓的重要驱动力。
  • ΔEEL:真空静电相互作用变化。通常为负(有利),但会被 ΔEGB 部分抵消。
  • ΔEGB:极性溶剂化的变化。受体与配体结合时部分极性基团去溶剂化,溶剂化能升高(正 ΔEGB),从而抵消部分真空静电收益。ΔEEL + ΔEGB 的和反映净静电贡献。
  • ΔESURF:非极性溶剂化的变化。结合时溶剂可及表面积减少,ΔESURF 为负,提供疏水自由能贡献。
  • ΔTOTAL:结合焓 ΔH 的估计值。在标准的 MMPBSA 流程中,它就是结合自由能计算中 ΔH 的部分。

因此,Enthalpy 部分的 Delta → TOTAL 正是所需要的 ΔH(对于 GB 或 PB)。


3. Entropy (-TΔS) 部分:相互作用熵的解读

我们上面的输入文件中设置了 interaction_entropy=1,因此结果中熵变部分显示为 IE,而非 NMODE。IE 方法从 MD 轨迹中直接估算熵变,其原理基于配体-受体相互作用能涨落与结合熵之间的关系:

-T\Delta S \approx kT \ln\langle e^{\beta \Delta E^{\text{int}}(t)} \rangle

其中 \Delta E^{\text{int}} 是配体与受体之间的相互作用能(气相下),尖括号表示系综平均。ie_segment=25 表示采用轨迹最后 25% 的帧进行涨落分析。

IE 方法得到的 -TΔS 会与选用的焓计算模型配对,因此你看到 Entropy → IE 下同时有 GBPB 两个数值,这并不代表 IE 本身依赖溶剂模型,而是表明它将被分别加和到 GB 或 PB 的 ΔH 上以形成最终的结合自由能。通常 IE 计算的熵贡献对结合不利(-TΔS 为正),因为结合过程限制了配体的平动、转动与构象自由度。


4. Binding (ΔG) 部分:最终结合自由能

这一层级将焓与熵直接相加:

  • GB+IE\Delta G = \Delta H_{\text{GB}} + (-T\Delta S)_{\text{IE}}
  • PB+IE\Delta G = \Delta H_{\text{PB}} + (-T\Delta S)_{\text{IE}}

输出的正值或负值直接指示结合亲和力:数值越负,结合越强。一般研究中会同时报告 GB 和 PB 的结果,并优先考虑 PB 作为更可靠的估值。

请添加图片描述


5. Decomposition 部分:残基级能量贡献

当输入文件中包含 &decomp 段落且 idecomp=2 时,gmx_MMPBSA 会将 Delta 能量进一步分解到单个残基上。idecomp=2 的含义是:基于残基进行分解,并将 1-4 相互作用按类型归类(1-4 EEL 加到 EEL,1-4 VDW 加到 VDW),以保证每个残基的总贡献更直观。

Decomposition 结果同样区分 GB 与 PB,并在 Complex、Receptor、Ligand、Delta 四个分类下显示每个残基的两种贡献类型:

  • TDC(Total Decomposition Contribution):残基的总能量贡献,包含主链和侧链原子。
  • SDC(Sidechain Decomposition Contribution):仅来自侧链原子的贡献。

请添加图片描述
请添加图片描述

Delta 下的 TDC 和 SDC 直接展示了每个残基对结合能的净贡献(单位 kcal/mol)。通常意义下,贡献低于 -1 kcal/mol 的残基被视为热点(hotspot),而具有较大正值贡献的残基可能对结合不利。

通过对比 TDC 与 SDC,可以判断某一残基的结合贡献主要来自侧链还是主链。例如,若某残基的 SDC 接近 TDC,则贡献几乎全由侧链提供;若 SDC 较小而 TDC 较大,则主链氢键或静电作用可能占主导。


6. 结果解读示例与注意事项

分析时建议读者按照以下逻辑进行:

  1. 首先查看 Binding (ΔG) 下的数值,确认计算是否给出合理的负值(通常 -5 至 -15 kcal/mol 为常见的小分子结合自由能)。
  2. 进入 Enthalpy → Delta,观察 ΔVDWAALS 和 ΔESURF 是否为负,ΔEEL 是否为负而 ΔEGB 为正。净静电贡献(ΔEEL + ΔEGB)在介电常数设置下可能为微弱有利或轻微不利,具体取决于体系极性。
  3. 查看 Entropy 的 -TΔS 值,如果绝对值很大且为正,则说明熵损失显著,结合可能由焓驱动。
  4. 利用 Decomposition → Delta TDC 找出贡献显著的残基,并与实验突变数据或相互作用指纹进行对照。
  5. 结合 GB 和 PB 的趋势一致性评估模型稳健性。若两者符号甚至量级差异过大,应检查参数(如 PB 网格大小、表面张力系数等)是否合理。

最后,所有能量数值均是平均值,并伴有一个标准偏差(可通过 gmx_MMPBSA_ana 或直接查看 FINAL_RESULTS_MMPBSA.dat 获取其中的详细数据)。当标准偏差远小于平均值时,结果才具有统计意义。


最后,Enthalpy 提供气相与溶剂化对结合的驱动信息,Entropy 补充构型限制的损耗,Binding 给出最终的结合强度,Decomposition 则直接定位关键残基。这是各个部件最主要的功能

    如果觉得本站对您有帮助,请随意赞赏。您的支持将鼓励本站走向更好!!

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注