[GROMACS]Martini 粗粒化力场:粗粒生物大分子模拟原理
前言
在计算生物物理与材料科学的领域,分子模拟的空间与时间尺度始终是一对核心矛盾。全原子分子动力学(AA-MD)能够提供原子级别的更高的精度,但同时计算成本使得模拟超过微秒量级、或超过数十万原子的体系变得极为困难。另一方面,连续介质模型虽然可以覆盖更大的尺度,却不可避免地丢失了分子层面的化学特异性。粗粒化(Coarse-Grained, CG)模型解决了这些问题,它通过降低自由度、平滑势能面,实现了效率与化学精度的权衡。
Martini 力场作为目前应用最广泛的通用型粗粒化模型,自其第一版发布以来,已经历了十余年的演进。2021 年发布的 Martini 3 版本,在保持“易用性”这一核心宗旨的前提下,对模型进行了彻底的重参数化,极大地拓展了化学空间,并解决了前代版本中长期存在的“过粘性”与分配行为失准等问题。本文章基于 Martini 核心开发者 Paulo C.T Souza 在相关研讨会上的技术讲解,系统梳理 Martini 力场的设计理念、Martini 2 的成功与局限,以及 Martini 3 的关键技术更新。您可以作为讲义去参考本篇文章的同时去看Martini官网的视频。
1. 粗粒化建模的基本要素
在开始讨论 Martini 之前,有必要明确任何分子模型都需要考虑的四个基本要素:
- 相互作用(Force):如何描述粒子之间的键合与非键合作用。
- 构型采样方法(Sampling):采用蒙特卡洛、分子动力学还是其他算法。
- 边界条件(Boundary Conditions):温度、压力控制以及周期性边界等。
- 分辨率(Resolution):从全原子、粗粒化到介观/连续介质模型。
粗粒化模型的核心在于分辨率的选择。通常,一个粗粒化珠子代表 2 到 4 个非氢原子及其连接的氢原子。这种简化的直接收益是计算速度的大幅提升(相比全原子方法可达 2~3 个数量级),同时能够访问更大的空间尺度(10 nm 至 μm 量级)与更长的时间尺度(100 ns 至 ms 量级)。然而,粗粒化并非没有代价:由于自由度降低,体系的熵信息被压缩,必须通过有效势进行补偿;此外,粗粒化模型的时间尺度与真实时间之间不存在普适的换算因子,这是所有 CG 模型共有的局限性。
2. Martini 2:一个成功的通用模型及其潜在问题
2.1 构建块方法与珠子类型
Martini 模型最大的特色是其 “Lego 积木”式的构建块方法。每个珠子代表一个小的化学片段,通过组合这些珠子可以搭建出从脂质、聚合物到蛋白质的各种分子。
在 Martini 2 中,珠子共有 18 种化学类型,划分为四大类:
- C(非极性):1~5 表示不同的疏水程度
- P(极性):1~5 表示极性梯度
- N(中等极性):结合供体/受体标签(d, a, da, 0)来描述氢键能力
- Q(带电):用于单价离子(+1/-1),同样带有氢键标签
此外,Martini 2 还引入了不同的珠子尺寸:常规型(0.47 nm,用于大多数线性或支链分子)、小型(0.43 nm,用于脂肪/芳香环,如胆固醇)、微小(0.32 nm,专用于核碱基的芳香环)。不同尺寸之间的交叉相互作用采用了一个极其简单的规则:始终使用较大珠子的直径。这一规则虽然实现简单,但后续证明正是导致若干问题的根源之一。

2.2 相互作用矩阵与参数化策略

Martini 力场的核心是一张如上图的相互作用矩阵,它直接定义了任意两种珠子之间的 Lennard-Jones(LJ)势参数。在全原子模型中,不同原子间的 LJ 参数通常由组合规则推算;而在 Martini 中,所有交叉作用都是预先离散化的——共有 10 个相互作用水平,从“超吸引”到“超排斥”。带电相互作用则通过反应场方法处理的库仑势单独描述。
其中的势能计算采用的是L-J势能和Coumbic的线性加和方式计算,公式如下
在参数化策略上,Martini 采取了 “自上而下”与“自下而上”相结合的混合方案:
- 非键相互作用:采用自上而下方法,以实验分配自由能(如水-辛醇分配系数)为基准进行校准。
- 键合相互作用:采用自下而上方法,从全原子模拟的轨迹中提取键长、键角、二面角的分布,拟合谐振子势或周期性势。
这种混合策略使得 Martini 既能复现重要的热力学性质,又能保持合理的分子内构象。
2.4 Martini2的深层问题
然而,随着应用范围的扩展,Martini 2 的若干系统性缺陷逐渐暴露:
错误的分配行为:尽管单个珠子的疏水性经过精心校准,但将珠子连接成分子后,某些分子的分配自由能与实验值出现严重偏差。这表明“构建块方法”在特定组合下失效。
结合能垒与过粘性:在特定溶剂中,分子解离时表现出非物理的能垒;蛋白质(尤其是可溶性蛋白)和糖类分子表现出过强的聚集倾向,被称为 Martini 2 的 “stickiness” 问题。

化学空间覆盖不足:多个化学性质迥异的基团(如酮、叔胺、醚)被迫使用相同或非常相似的珠子,导致溶解度预测失败。例如,本应互溶的苯与某些溶剂在模拟中发生相分离。

蛋白质空腔塌陷与柔性缺失:由于交叉作用的尺寸处理过于粗糙,蛋白质内部空腔(如 GPCR 的结合口袋)完全干燥,水分子和离子无法进入。同时,蛋白质的整体柔性也受到限制。
温度依赖性问题:疏水效应随温度的变化趋势未能正确捕捉。
上述问题表明,局部的修修补补已无法解决根本矛盾。开发团队最终决定:彻底重新参数化,构建一个全新的 Martini 3 模型。
3. Martini 3:重新构建整个系统
Martini 3 的开发历时数年,经历了 4 次从头开始的重构(即重新定义珠子的尺寸、相互作用水平、映射规则等)。整个参数化过程遵循一个多层次的验证流程:
- Tier I:以小分子为对象,校准水-油分配、互溶性及其他次级性质。
- Tier II:测试定性特征,如可溶性蛋白是否自发聚集、聚合物是否发生非物理相分离。
- Tier III:定量验证,需要多达 26 位研究人员的协作,对比实验与全原子模拟数据。
3.1 珠子类型与化学空间的大幅扩展
Martini 3 在保留四大类(C, N, P, Q)的基础上,进行了以下扩展:
- 极性程度的细化:C、I(原N类中的非极性部分)、P 类均拥有 6 个极性水平(原为 5 个),Q 类拥有 5 个水平。
- 新增类别:X 类专门用于卤代化合物(此前归入 C 类);W 类作为水的专有珠子(Martini 2 中水属于 P 类);D 类专门处理二价及带电复杂粒子。
- 化学类型总数:从 Martini 2 的 18 种增加至 29 种。

若再结合尺寸维度(常规、小型、微小)以及新增的 9 种功能标签(如供体/受体、疏水极化率等),Martini 3 可区分的珠子种类从 Martini 2 的 54 种(18种化学类型 × 3种尺寸)跃升至 843 种。相应地,相互作用矩阵中的成对参数数量也急剧增加,相互作用水平从 10 级扩展到 22 级。
3.2 重新定义尺寸与交叉作用规则
在 Martini 3 中,珠子尺寸不再与特定分子类别强行绑定,而是与映射方案(即多少个原子对应一个珠子)相关:存在 4:1、3:1、2:1 等映射比例。微小尺寸(0.32 nm)特别适用于模拟平坦的芳香体系(如石墨烯、卟啉环)。
最关键的变化在于交叉作用的处理:不再机械地使用较大珠子的直径,而是采用两种珠子直径的平均值。这一看似简单的改变,结合重新校准的 LJ 深度,成功解决了蛋白质空腔干燥和过粘性问题。

3.3 分配性质的显著改善
通过对超过 100 种小分子的水-辛醇分配自由能进行重新拟合,Martini 3 的预测误差普遍控制在 2.5 kJ/mol 以内,覆盖范围从 -40 到 +40 kJ/mol。相比之下,Martini 2 在极性范围的极端区域存在系统性偏差。
3.4 蛋白质模型的进化
Martini 3 对蛋白质的粗粒化表示进行了重构:
- 侧链:重新平衡每个侧链珠子的原子数与尺寸的对应关系,避免过度映射或映射不足。
- 主链:Martini 2 中主链珠子的类型依赖于二级结构(如螺旋、折叠),Martini 3 则采用统一的主链珠子,仅在少数残基为适应映射而保留变体。
- 三级结构维持:仍然需要引入额外的偏置势(如弹性网络模型或 Go 模型),但当前版本已逐步向更灵活的 Go 模型过渡。
这些改进带来了实实在在的可观测结果:GPCR 等蛋白的跨膜通道不再干燥,水分子和钠离子可以进入空腔并与关键残基相互作用;可溶性蛋白的聚集倾向大幅降低,且盐浓度对蛋白质溶解性的影响趋势与实验一致;跨膜蛋白的二聚化结合自由能与结合模式均更接近 NMR 或晶体结构。
后面我们会进一步来讨论Martin力场中蛋白质模型由弹性网络模型到GO模型的变化。
5. 总结
Martini 3 是一次对粗粒化力场的一次重要重构。它通过以下关键革新,将模型的适用范围和精度提升到了一个新高度:
- 化学空间:从 54 种有效珠子扩展至 843 种,覆盖更丰富的有机官能团。
- 相互作用:22 个相互作用级别 + 基于平均直径的交叉作用规则,消除过粘性并打开蛋白质内部空腔。
- 参数化:多层级验证(小分子 → 定性特征 → 定量数据),结合 26 位研究人员的协同努力。
- 蛋白质模型:统一的骨架表示、重新平衡的侧链,以及向 Go 模型的过渡。
当然,Martini 3 并非终点。当前团队仍在针对液态蛋白质、材料科学等方向组建专门的任务组,持续改进模型。对于希望加入这一领域的模拟工作者而言,Martini 3 提供了一个兼具效率、精度与易用性的强大平台——只要记住一点:粗粒化模型是对真实世界的有效近似,其背后的驱动力(熵 vs. 焓)需要谨慎解释。
如果你对 Martini 3 的具体应用(如蛋白-配体结合、脂质膜重塑、聚合物自组装)感兴趣,可以关注研讨会后续的专题教程与开发者交流。未来,自动化映射工具和更智能的 Go 模型偏置势将成为该力场进一步发展的关键方向。
参考文献(基于讲座内容整理)
- Martini 3 原始论文:Souza et al., Nat. Methods, 2021.
- Martini 2 原始论文:Marrink et al., J. Phys. Chem. B, 2007.
- 研讨会视频及讲义:主讲人 Paolo, Martini 3 Workshop.



