[GROMACS]Martini 粗粒化力场：粗粒生物大分子模拟原理

发布者: 站长-R 分类: 分子动力学模拟,计算机大类发布时间: 2026-04-06 16:48 访问量: 241 次浏览

前言

在计算生物物理与材料科学的领域，分子模拟的空间与时间尺度始终是一对核心矛盾。全原子分子动力学（AA-MD）能够提供原子级别的更高的精度，但同时计算成本使得模拟超过微秒量级、或超过数十万原子的体系变得极为困难。另一方面，连续介质模型虽然可以覆盖更大的尺度，却不可避免地丢失了分子层面的化学特异性。粗粒化（Coarse-Grained, CG）模型解决了这些问题，它通过降低自由度、平滑势能面，实现了效率与化学精度的权衡。

Martini 力场作为目前应用最广泛的通用型粗粒化模型，自其第一版发布以来，已经历了十余年的演进。2021 年发布的 Martini 3 版本，在保持“易用性”这一核心宗旨的前提下，对模型进行了彻底的重参数化，极大地拓展了化学空间，并解决了前代版本中长期存在的“过粘性”与分配行为失准等问题。本文章基于 Martini 核心开发者 Paulo C.T Souza 在相关研讨会上的技术讲解，系统梳理 Martini 力场的设计理念、Martini 2 的成功与局限，以及 Martini 3 的关键技术更新。您可以作为讲义去参考本篇文章的同时去看Martini官网的视频。

1. 粗粒化建模的基本要素

在开始讨论 Martini 之前，有必要明确任何分子模型都需要考虑的四个基本要素：

相互作用（Force）：如何描述粒子之间的键合与非键合作用。
构型采样方法（Sampling）：采用蒙特卡洛、分子动力学还是其他算法。
边界条件（Boundary Conditions）：温度、压力控制以及周期性边界等。
分辨率（Resolution）：从全原子、粗粒化到介观/连续介质模型。

粗粒化模型的核心在于分辨率的选择。通常，一个粗粒化珠子代表 2 到 4 个非氢原子及其连接的氢原子。这种简化的直接收益是计算速度的大幅提升（相比全原子方法可达 2～3 个数量级），同时能够访问更大的空间尺度（10 nm 至 μm 量级）与更长的时间尺度（100 ns 至 ms 量级）。然而，粗粒化并非没有代价：由于自由度降低，体系的熵信息被压缩，必须通过有效势进行补偿；此外，粗粒化模型的时间尺度与真实时间之间不存在普适的换算因子，这是所有 CG 模型共有的局限性。

2. Martini 2：一个成功的通用模型及其潜在问题

2.1 构建块方法与珠子类型

Martini 模型最大的特色是其 “Lego 积木”式的构建块方法。每个珠子代表一个小的化学片段，通过组合这些珠子可以搭建出从脂质、聚合物到蛋白质的各种分子。

在 Martini 2 中，珠子共有 18 种化学类型，划分为四大类：

C（非极性）：1～5 表示不同的疏水程度
P（极性）：1～5 表示极性梯度
N（中等极性）：结合供体/受体标签（d, a, da, 0）来描述氢键能力
Q（带电）：用于单价离子（+1/-1），同样带有氢键标签

此外，Martini 2 还引入了不同的珠子尺寸：常规型（0.47 nm，用于大多数线性或支链分子）、小型（0.43 nm，用于脂肪/芳香环，如胆固醇）、微小（0.32 nm，专用于核碱基的芳香环）。不同尺寸之间的交叉相互作用采用了一个极其简单的规则：始终使用较大珠子的直径。这一规则虽然实现简单，但后续证明正是导致若干问题的根源之一。
在这里插入图片描述

2.2 相互作用矩阵与参数化策略

在这里插入图片描述

Martini 力场的核心是一张如上图的相互作用矩阵，它直接定义了任意两种珠子之间的 Lennard-Jones（LJ）势参数。在全原子模型中，不同原子间的 LJ 参数通常由组合规则推算；而在 Martini 中，所有交叉作用都是预先离散化的——共有 10 个相互作用水平，从“超吸引”到“超排斥”。带电相互作用则通过反应场方法处理的库仑势单独描述。

其中的势能计算采用的是L-J势能和Coumbic的线性加和方式计算，公式如下在这里插入图片描述

在参数化策略上，Martini 采取了 “自上而下”与“自下而上”相结合的混合方案：

非键相互作用：采用自上而下方法，以实验分配自由能（如水-辛醇分配系数）为基准进行校准。
键合相互作用：采用自下而上方法，从全原子模拟的轨迹中提取键长、键角、二面角的分布，拟合谐振子势或周期性势。

这种混合策略使得 Martini 既能复现重要的热力学性质，又能保持合理的分子内构象。

2.4 Martini2的深层问题

然而，随着应用范围的扩展，Martini 2 的若干系统性缺陷逐渐暴露：

错误的分配行为：尽管单个珠子的疏水性经过精心校准，但将珠子连接成分子后，某些分子的分配自由能与实验值出现严重偏差。这表明“构建块方法”在特定组合下失效。
结合能垒与过粘性：在特定溶剂中，分子解离时表现出非物理的能垒；蛋白质（尤其是可溶性蛋白）和糖类分子表现出过强的聚集倾向，被称为 Martini 2 的 “stickiness” 问题。
化学空间覆盖不足：多个化学性质迥异的基团（如酮、叔胺、醚）被迫使用相同或非常相似的珠子，导致溶解度预测失败。例如，本应互溶的苯与某些溶剂在模拟中发生相分离。
蛋白质空腔塌陷与柔性缺失：由于交叉作用的尺寸处理过于粗糙，蛋白质内部空腔（如 GPCR 的结合口袋）完全干燥，水分子和离子无法进入。同时，蛋白质的整体柔性也受到限制。
温度依赖性问题：疏水效应随温度的变化趋势未能正确捕捉。

上述问题表明，局部的修修补补已无法解决根本矛盾。开发团队最终决定：彻底重新参数化，构建一个全新的 Martini 3 模型。

3. Martini 3：重新构建整个系统

Martini 3 的开发历时数年，经历了 4 次从头开始的重构（即重新定义珠子的尺寸、相互作用水平、映射规则等）。整个参数化过程遵循一个多层次的验证流程：

Tier I：以小分子为对象，校准水-油分配、互溶性及其他次级性质。
Tier II：测试定性特征，如可溶性蛋白是否自发聚集、聚合物是否发生非物理相分离。
Tier III：定量验证，需要多达 26 位研究人员的协作，对比实验与全原子模拟数据。

3.1 珠子类型与化学空间的大幅扩展

Martini 3 在保留四大类（C, N, P, Q）的基础上，进行了以下扩展：

极性程度的细化：C、I（原N类中的非极性部分）、P 类均拥有 6 个极性水平（原为 5 个），Q 类拥有 5 个水平。
新增类别：X 类专门用于卤代化合物（此前归入 C 类）；W 类作为水的专有珠子（Martini 2 中水属于 P 类）；D 类专门处理二价及带电复杂粒子。
化学类型总数：从 Martini 2 的 18 种增加至 29 种。

若再结合尺寸维度（常规、小型、微小）以及新增的 9 种功能标签（如供体/受体、疏水极化率等），Martini 3 可区分的珠子种类从 Martini 2 的 54 种（18种化学类型 × 3种尺寸）跃升至 843 种。相应地，相互作用矩阵中的成对参数数量也急剧增加，相互作用水平从 10 级扩展到 22 级。

3.2 重新定义尺寸与交叉作用规则

在 Martini 3 中，珠子尺寸不再与特定分子类别强行绑定，而是与映射方案（即多少个原子对应一个珠子）相关：存在 4:1、3:1、2:1 等映射比例。微小尺寸（0.32 nm）特别适用于模拟平坦的芳香体系（如石墨烯、卟啉环）。

最关键的变化在于交叉作用的处理：不再机械地使用较大珠子的直径，而是采用两种珠子直径的平均值。这一看似简单的改变，结合重新校准的 LJ 深度，成功解决了蛋白质空腔干燥和过粘性问题。
在这里插入图片描述

3.3 分配性质的显著改善

通过对超过 100 种小分子的水-辛醇分配自由能进行重新拟合，Martini 3 的预测误差普遍控制在 2.5 kJ/mol 以内，覆盖范围从 -40 到 +40 kJ/mol。相比之下，Martini 2 在极性范围的极端区域存在系统性偏差。

3.4 蛋白质模型的进化

Martini 3 对蛋白质的粗粒化表示进行了重构：

侧链：重新平衡每个侧链珠子的原子数与尺寸的对应关系，避免过度映射或映射不足。
主链：Martini 2 中主链珠子的类型依赖于二级结构（如螺旋、折叠），Martini 3 则采用统一的主链珠子，仅在少数残基为适应映射而保留变体。
三级结构维持：仍然需要引入额外的偏置势（如弹性网络模型或 Go 模型），但当前版本已逐步向更灵活的 Go 模型过渡。

这些改进带来了实实在在的可观测结果：GPCR 等蛋白的跨膜通道不再干燥，水分子和钠离子可以进入空腔并与关键残基相互作用；可溶性蛋白的聚集倾向大幅降低，且盐浓度对蛋白质溶解性的影响趋势与实验一致；跨膜蛋白的二聚化结合自由能与结合模式均更接近 NMR 或晶体结构。

后面我们会进一步来讨论Martin力场中蛋白质模型由弹性网络模型到GO模型的变化。

5. 总结

Martini 3 是一次对粗粒化力场的一次重要重构。它通过以下关键革新，将模型的适用范围和精度提升到了一个新高度：

化学空间：从 54 种有效珠子扩展至 843 种，覆盖更丰富的有机官能团。
相互作用：22 个相互作用级别 + 基于平均直径的交叉作用规则，消除过粘性并打开蛋白质内部空腔。
参数化：多层级验证（小分子 → 定性特征 → 定量数据），结合 26 位研究人员的协同努力。
蛋白质模型：统一的骨架表示、重新平衡的侧链，以及向 Go 模型的过渡。

当然，Martini 3 并非终点。当前团队仍在针对液态蛋白质、材料科学等方向组建专门的任务组，持续改进模型。对于希望加入这一领域的模拟工作者而言，Martini 3 提供了一个兼具效率、精度与易用性的强大平台——只要记住一点：粗粒化模型是对真实世界的有效近似，其背后的驱动力（熵 vs. 焓）需要谨慎解释。

如果你对 Martini 3 的具体应用（如蛋白-配体结合、脂质膜重塑、聚合物自组装）感兴趣，可以关注研讨会后续的专题教程与开发者交流。未来，自动化映射工具和更智能的 Go 模型偏置势将成为该力场进一步发展的关键方向。

参考文献（基于讲座内容整理）

Martini 3 原始论文：Souza et al., Nat. Methods, 2021.
Martini 2 原始论文：Marrink et al., J. Phys. Chem. B, 2007.
研讨会视频及讲义：主讲人 Paolo, Martini 3 Workshop.

Martini力场分子动力学生物信息

HUI-MY.梦苑

[GROMACS]Martini 粗粒化力场：粗粒生物大分子模拟原理

前言

1. 粗粒化建模的基本要素