高分辨质谱不要只盯质量精度,即使质量精度低于 1 ppm 仍不足以确定未知物的分子式

在探索生命奥秘的征程中,代谢组学肩负着一项雄心勃勃的使命——鉴定并量化生物体内所有的小分子代谢物。质谱技术,作为这场探索中的“超级显微镜”,凭借其高灵敏度成为了研究者的得力助手。然而,面对一次检测中涌现的成百上千个未知代谢物,如何快速准确地给它们“上户口”(确定化学结构),一直是领域内的核心挑战。
常规思路认为,只要质谱仪的质量精度足够高,就能直接算出唯一的化学式。但Tobias Kind和Oliver Fiehn发表于2006年《BMC Bioinformatics》的经典研究,却打破了这一迷思,并指出了一个被许多人忽视的关键环节。

1. 困局:为什么超高精度质谱也“傻傻分不清”?
鉴定未知代谢物的第一步,是确定其元素组成(即化学式,如C₆H₁₂O₆)。这需要依靠质谱仪测量的精确质量。精度通常用ppm(百万分之一)表示,数值越小,精度越高。
研究者通过计算机生成了超过160万个在0-500 Da(分子量单位)内、化学上合理的分子式进行模拟。结果令人惊讶:即使动用一台精度高达0.1 ppm的“梦幻”质谱仪,对于一个质量在400-500 Da的中等大小分子,仍然会匹配到几十个甚至上百个可能的化学式。

质量范围在 200 单位至 300 单位内的化学式(碳、氢、氮、硫、氧和磷)的可能数量的趋势分布直方图。
为什么会这样?因为自然界物质的多样性远超我们想象。随着分子量增大,碳、氢、氧、氮、硫、磷等元素可以组合出的、质量近乎相同的化学式数量会急剧上升,形成“选择困难症”。这就好比单凭体重无法在人群中精准定位一个人一样。
2. 破局:同位素模式——化学式的“天然指纹”
那么,出路何在?该研究给出了一个强大而优雅的解决方案:引入同位素丰度信息作为“正交过滤器”。
· 什么是同位素? 自然界中的大部分元素都有几种质量不同的原子形式,即同位素。例如,碳元素主要是¹²C(原子量为12),但也有约1.1%的¹³C(原子量为13.00335)。
· 什么是同位素模式? 一个分子由不同同位素的原子组合而成,其在质谱图中会呈现出一组特征峰:主峰(M,由最轻的同位素组成)以及紧随其后的M+1、M+2等同位素峰。这些峰的相对高度(丰度)构成了该化学式独一无二的“指纹”。
理论研究证实,结合同位素信息后,可以轻松排除掉95%以上的错误候选化学式。 例如,一个质量在615.324 Da附近的分子,单凭5 ppm的质量精度会找到370个可能化学式;而加上5%的同位素丰度误差过滤后,候选者骤减至12个。这无疑为后续的结构鉴定工作扫清了绝大部分障碍。

M+1 和 M+2 离子的同位素丰度可用于筛选分子式候选物。此示例展示了硅化山梨醇的同位素丰度模式。红色圆圈表示包含正确目标的 5% 区域。如果质谱仪在同位素丰度方面存在 5% 的误差(均方根误差),则所有其他分子式均可排除。
3. 颠覆性结论:3 ppm + 2%的同位素误差,胜过 0.1 ppm!
这项研究最引人深思的结论在于对质谱仪性能的重新评估:
一台质量精度为3 ppm,但能准确测量同位素丰度(误差控制在2%以内)的质谱仪,在鉴定未知代谢物化学式方面,其综合表现甚至优于一台质量精度高达0.1 ppm却不利用同位素信息的“梦幻”质谱仪。

不同质量精度水平下可能存在的分子式数量以及同位素丰度精度的影响。一台能够达到 3ppm 精度但具有 2%同位素误差的准确同位素模式的质谱仪,其性能甚至优于一台(并不存在的)具有 0.1ppm 质量精度的质谱仪!这些结果是针对随机选取的目标进行计算得出的,所以单个结果会有所不同,但趋势保持不变。
这意味着,在追求超高质量精度的同时,绝不能忽视对同位素丰度测量准确性的要求。两者结合,才能发挥出“1+1远大于2”的效果。然而,在实际操作中,如何精准地获取并利用同位素信息,对许多研究人员来说仍是一个技术门槛。
4. 从理论到实践:MassWorks如何将同位素信息的威力“一键解锁”?
上述经典理论指出了明确的方向,而像MassWorks这样的专业软件,则扮演了“桥梁”的角色,将这一强大理论转化为每个研究人员触手可及的简单操作。它的核心优势正是对同位素信息的深度挖掘和利用,具体体现在:
1)精准的“谱图校准”功能:MassWorks拥有独特的校准算法,能够优化质谱图的峰形。这对于准确测量同位素峰的丰度至关重要,因为重叠或不规则的峰形会直接导致丰度计算误差。通过校准,它为后续的同位素分析打下了坚实可靠的数据基础。

MassWorks软件的高分辨质谱谱图校正sCLIPS的原理——sCLIPS 功能仅通过峰形校正,将实际峰形函数转化为已知的数学函数 —— 该过程以测得的单同位素峰本身作为校正标准。当这一功能应用于未知离子的整个同位素丰度分布时,未知离子的同位素丰度分布会被转化为具有相同已知峰形函数的校正后同位素丰度分布,随后该分布将用于计算任意给定候选分子式的理论质谱图,从而实现具有高谱图准确度(SA)的精确同位素模拟。
2)强大的“同位素丰度拟合与评分”系统:这是其核心优势。软件可以自动计算每个候选化学式的理论同位素分布,并将其与实验测得的真实谱图进行拟合比较,最终给出一个相似度评分(如满分100)——谱图准确度(Spectral Accuracy)。研究人员只需一眼就能根据评分高低,从数十个候选化学式中快速锁定最可能的一个或几个,实现了从“海选”到“精选”的飞跃。

丁螺环酮(C21H32O2N5)在FT-ICRMS高分辨质谱上的分子式测定结果,在仅包含 C、H、N、O 四种元素,且质量偏差为 2.5 ppm 的条件下,对 m/z 386.2548 的离子进行搜索,仅得到两种可能的分子式(见上图表中的第一个和第三个分子式);但如果在相同质量偏差(2.5 ppm)下,分子式检索时额外加入 F 和 P 两种元素,则会得到 11 种可能的分子式。F 和 P 是单同位素峰中出了名的 “干扰元素”—— 在检索中加入这两种元素只会增加候选分子式的数量,而无法提供独特的同位素信息。

基于同位素精细结构的分子式确定——为仔细观察 A+1 和 A+2 峰的同位素精细结构,将该质量范围内峰的强度相对于最强峰进行归一化处理;黑色为理论计算质谱图;红色光为sCLIPS校正后的质谱图(分辨率 RP=4M)。
3)提升现有仪器的潜力:即使你使用的不是天价的超高分辨率质谱仪(如FT-ICR-MS),MassWorks也能通过其先进的算法,在一定程度上“增强”数据的解析能力,帮助在复杂的谱图中更清晰地分辨出同位素峰,从而让普通的四极杆质谱仪也能发挥出更佳的鉴定效能。

四极杆质谱上通过MassWorks软件测定四亚甲基二砜四胺,其质量偏差13mDa,在20mDa的偏差范围内,共有35个分子式,正确的分子式C₄H₈N₄O₄S₂的分子离子中含有 2 个硫原子,其谱图准确度为 99.2%,排名第一。另一方面,在相同的搜索条件下,即使是任何含 3 个或 1 个硫原子的分子与该未知物的最佳匹配结果,也会因谱图准确度差异过大而被排除。

四亚甲基二砜四胺(C₄H₈N₄O₄S₂)分子式的理论谱图与校正谱图的叠加图(2个S原子能在“A+2”处明显重合,其它任何S原子数将在“A+2”处出现严重的不匹配)
5. 结语
总而言之,Kind和Oliver Fiehn的这篇经典文献为我们打开了视角:精确质量是“坐标”,而同位素模式是确认“身份”的指纹。借助像MassWorks这样以同位素分析见长的软件,任何实验室都能轻松地将这一强大理论付诸实践。
它极大地降低了对质谱硬件的要求和技术门槛,让研究人员能从令人困惑的候选化学式列表中快速、自信地做出判断,将质谱数据的价值最大化,真正解锁了同位素信息在分子式鉴定中的全部潜力,从而在代谢组学、天然产物、司法鉴定、香精香料及风味、环境分析等小分子鉴定领域走得更快、更稳、更远。
关于MassWorks 软件
MassWorks软件是由 Cerno Bioscience 公司开发的一款革命性的MS数据定性分析软件,能帮助我们在低分辨率的四极杆GC/MS、LC/MS直接测定化合物的精确质量,并通过独有的谱图准确度概念确定出准确的分子式。MassWorks软件同样适用于高分率质谱(TOF、Orbitrap)的定性分析。
关于绿绵科技
绿绵科技是Cerno Bioscience公司在中国区的总代理商,负责Cerno公司旗下的MassWorks、GC/ID 等产品市场推广、销售、售前/售后技术支持、应用支持。
若您想了解获取 MassWorks 产品的更多信息或应用,欢迎致电绿绵科技!
关于绿绵科技
北京绿绵科技有限公司(简称:绿绵科技)以体现客户服务价值为宗旨,以专业精神和技能为广大实验室分析工作者提供样品前处理、样品制备及分析、实验数据精确分析和管理的全面解决方案,致力于协助客户提高分析检测的效率和水平。主要代理产品联系电话:010-82676061/2/3/4/5/6/7/8
E-mail:info@lumtech.com.cn。
