蛋白质组学/蛋白质鉴定 - 质谱/质谱应用
本节
通过质谱法进行蛋白质鉴定的过程主要通过两种方式完成
- 肽质量指纹图谱
- 串联质谱
肽质量指纹图谱通常使用从光谱中获得的肽的质量来核对预测肽质量的数据库。这些预测质量是通过对已记录良好的蛋白质列表进行消化而记录下来的。如果蛋白质序列中预测到的质量中有相当数量与实验值匹配,那么该蛋白质很有可能存在于样品中。基质辅助激光解吸电离飞行时间 (MALDI-TOF) 质谱仪是通常用于这种类型的肽分析的仪器。
另一种常用的技术是串联质谱。该技术利用碰撞诱导解离。此过程会在肽主链内断裂蛋白质,由于这种断裂,可以比较观察到的片段大小和预测质量的数据库。与串联质谱方法非常类似的是肽片段指纹图谱或“PFF”。该方法不使用碰撞诱导解离,而是使用单个肽的酶解产生片段模式。分析这些片段,并将其与特定酶的观察到的片段数据库进行比较,这种方法类似于串联质谱方法。串联质谱和肽片段指纹图谱也可以用于蛋白质测序。
大约四到五个肽足以准确地识别具有已知氨基酸序列的蛋白质。令人惊讶的是,随着数据库中识别信息的增加,识别特定蛋白质所需的信息量也会增加。随着时间的推移,识别蛋白质所需的肽数量有所增加。在某些情况下,特定肽片段或少数罕见组合的片段是特定类型或类别蛋白质所独有的。该片段或片段组可用作特征肽来识别特定蛋白质的存在。这些特征片段存在于碰撞诱导解离和酶解中。将片段识别为有效的特征片段需要大量的背景信息。
串联质谱可以与片段方法(如胰蛋白酶消化)结合使用。这使样品能够生成不同长度的重叠肽。该方法的工作原理与基因组测序仪采用的方法类似,它们生成重叠的 DNA 序列片段并组装成基因组。在质谱图上,两个重叠峰之间的质量差可用于根据氨基酸重量的已记录数据确定序列差异。通常使用一个或多个与适当数据库(如欧洲生物信息学研究所的国际蛋白质指数 (IPI)或 NCBI 提供的 nr(非冗余)蛋白质序列数据库)链接的搜索算法来确定序列。常用的搜索算法包括 SEQUEST、X! Tandem 和 MASCOT。
有几种方法可用于使用质谱法定量蛋白质。这些方法通常涉及一些标记方法来区分两种不同的细胞类型。在同位素标记中,更重的同位素被引入一个样品,而更轻的同位素被用来标记另一个样品。在进行质谱分析之前,将这两个差异标记的样品混合。与样品相关的肽片段可以通过其质量差异来区分。定量是通过比较质谱图上强度峰的比率来获得相对丰度。目前存在多种方法被广泛应用于定量蛋白质组学,包括细胞培养中氨基酸的稳定同位素标记、同位素编码亲和标签和金属编码标签。
定量蛋白质组学的目标是确定有关特定蛋白质样品的定量信息。尽管定性方法提供了有价值的见解,但定量数据集提供了更大的理解。定量蛋白质组学是一种基于质谱法应用的细胞技术。这种定量技术能够检测蛋白质及其翻译后修饰在生物系统中的定量变化。
通常,主要的定量蛋白质组学方法有助于进行蛋白质复合物的分析,其中优先考虑的是获取有关目标蛋白亲和标记的真实相互作用的信息。此操作对于提供对已知蛋白的新相互作用的某种理解至关重要,这可以揭示未知蛋白的奥秘。真实蛋白相互作用可以通过诱饵蛋白和通常在有或没有稳定同位素的情况下进行的蛋白质复合物来检查。对蛋白复合物相互作用的研究得益于亲和纯化和特定的定量蛋白质组学技术,例如可裂解 ICAT、iTRAQ 和 DNA 亲和纯化的组合。
蛋白质复合物的定量蛋白质组学分析还有助于确定不同细胞条件下蛋白质复合物中蛋白质-蛋白质相互作用的变化。例如,一种基于 SILAC(细胞培养中氨基酸稳定同位素标记)的方法被用来检查 TATA 结合蛋白及其在细胞周期中的磷酸化状态的机制。此外,SILAC 提供了对某些条件下昼夜节律机制特征和细胞外信号调节激酶相互作用的分析。
定量蛋白质组学在蛋白质相互作用网络分析中已成为一项有用的应用。尽管在发现蛋白质复合物方面采用了先进的技术方法,但这些复合物主要与其他蛋白质复合物一起发挥作用,大多数蛋白质存在于多个不同的复合物中。因此,定量蛋白质组学能够确认蛋白质复合物在与蛋白质复合物相互作用时的多种功能,并解决确定蛋白质-蛋白质相互作用概率的问题。
蛋白质组学研究通常分为发现蛋白质组学和靶向蛋白质组学。发现蛋白质组学通过为每个蛋白质样品投入更多时间并限制样品数量来优化蛋白质的鉴定。相反,靶向蛋白质组学限制了要分析的特征数量,然后有效地进行色谱分离,以通过多个样品获得最高的灵敏度。
此外,由于肽样品的电离效率,质谱法的使用本身不会产生定量结果。因此,相对和绝对丰度定量蛋白质组学作为子类技术发展起来。通过对样品进行单独的质谱分析并比较光谱,可以获得相对定量,以确定一个样品中肽的丰度与另一个样品相比。通常情况下,相对蛋白质组学定量需要一个涉及稳定同位素的标记过程;这使得质谱仪能够区分相同蛋白质的不同样品。绝对蛋白质组学定量利用同位素肽,将已知浓度的合成致密同位素体靶肽引入样品,然后进行液相色谱-质谱法。与相对定量一样,绝对蛋白质组学定量也使用同位素标记。但是,实验靶肽样品与重肽进行比较,并通过预先确定的标准曲线反向计算至标准品的起始浓度,从而实现靶肽的定量。
定量蛋白质组学是一个不断发展和高度可更新的研究领域。由于定量蛋白质组学分析,大量生物学问题得到了解决和解决。
质谱法已被用作细菌识别的工具,通过“指纹识别”基于其蛋白质组学库来识别物种,尽管直到最近,使用这种方法的工作因其依赖于高分辨率数据而受阻,因此需要高精度仪器的成本很高。最近在使该方法更易获得方面取得了成功,成功地使用MALDI(基质辅助激光解吸/电离)质谱法,该方法使用相对低能量的氮激光进行电离,并且还通过在基质上支撑大型脆弱的蛋白质物种来稳定它们。这些改进有助于最大程度地减少蛋白质物种的碎裂,并最终降低所得质谱图的复杂性,从而减少对高分辨率数据的需求,因此可以使用较便宜的中档光谱仪进行该过程。
基于质谱法的细菌鉴定优于当前的差异化方法,这些方法通常涉及多个测试,以基于生理、血清学、化学分类学和总体生化特征来识别物种,每个测试都需要耗时的培养步骤。相比之下,质谱法通常需要几小时,并且只需要一个培养步骤来增加细胞数量和纯度。
识别是使用数据库实现的,该数据库与当前用于识别未知化学化合物的数据库类似。对特定细菌物种进行多次光谱采集并进行平均以消除噪声,所得平均光谱用作该物种的蛋白质组学指纹。然后将其存储在公共数据库中,当测试未知样本时,其光谱将通过特定于数据库的统计算法进行比较,并根据与数据库库成员的拟合程度进行识别。
在制药行业,质谱法被用于分析复杂的样本混合物,例如血液、尿液、淋巴液,并与高灵敏度方法结合使用以测量低剂量和长时间点数据。最常用的技术是LC/MS与三重四极杆质谱仪联用。
质谱法的灵敏度使人们能够进行微剂量实验的测量,这些实验最大程度地减少了动物实验的必要性,微剂量实验和动物模型实验之间观察到的化合物效果大约有70%的一致性。
研究表明,肿瘤可以将蛋白质引入各种体液中,而这些蛋白质在这些位置通常不会以这些浓度存在。这引起了人们对质谱法在通过分析这些体液来早期临床检测癌症方面的应用的兴趣。这些与疾病相关的分子被称为生物标志物。与这种分析方法的临床使用相关的問題是假阳性和假阴性的问题。正在研究由多种蛋白质组成的蛋白质特征是否能够提供足够质量的诊断指标以用于临床环境。
这种类型的质谱分析存在许多障碍。
- 样本之间,甚至同一个人之间蛋白质含量的差异使得构建疾病特征非常复杂。
- 存在高动态范围的蛋白质浓度,生物标志物可能存在于该范围的边缘。
- 质谱法(最常见的是SELDI TOF)的准确性和可重复性。
边缘分级技术为快速筛选潜在生物标志物提供了一种强大的基于密度的分离和富集方法。这种方法在一项研究中被用于研究氧化应激生物标志物谷胱甘肽过氧化物酶 1 (GPx1) 和葡萄糖调节蛋白 75 (GRP75),这是由于叶酸缺乏造成的。该研究发表在《基于密度的蛋白质组学样本分级技术:叶酸缺乏引起的肝脏和大脑氧化应激反应》一文中。
- Hopper S, Johnson RS, Vath JE, Biemann K.,兔子骨髓中的谷胱甘肽还原酶。纯化、表征和串联质谱法确定的氨基酸序列。 [1]
- 蛋白质复合物和晶状体组织中蛋白质修饰的散弹枪鉴定 [2]
- Hunt DF, Yates JR, Shabanowitz J, Winston S, 和 Hauer CR, 串联质谱法蛋白质测序
- N Bandeira, H Tang, V Bafna, P Pevzner, 串联质谱组装的散弹枪蛋白质测序
- Clarke W, Zhang Zhen, Chan DW. 临床蛋白质组学在癌症和其他疾病中的应用。Clin Chem Lab Med 2003;41(12):1562-1570。
- http://proteomics.cancer.gov/proteomics_basics/backgrounder.asp
- 临床蛋白质组学:我们已经实现了吗?
- 蛋白质组学与癌症:情况说明书
- Wagner M, Naiky D, Pothenz A, 从质谱数据中进行疾病分类的方案
- Lan W, Guhaniyogi J, Horn MJ, Xia JQ, Graham B. J Biomol Tech. 2007 年 9 月 18 日(4):213–225。 基于密度的蛋白质组学样本分级技术:叶酸缺乏引起的肝脏和大脑氧化应激反应
- Sauer, S,等人。通过质谱法和计算分析对细菌进行分类和鉴定。PLoS ONE 3(7):e2843.doi:10.1371/journal.pone.0002843
Sauer, S,等人。通过质谱法和计算分析对细菌进行分类和鉴定。PLoS ONE 3(7):e2843.doi:10.1371/journal.pone.0002843
主要关注点
一种与数据库设计相结合的替代方法,旨在使基于质谱法的细菌鉴定更易获得。
摘要
Sauer 等人的意图是扩大基于质谱法的微生物鉴定程序的使用范围并提高其效率。此类程序已被证明以前是成功的,但识别基于蛋白质组的细菌物种需要高分辨率数据,这使得设备的总体成本更高。因此,质谱微生物识别领域并不经常使用,因此在广泛的现场测试中既没有得到充分发展也没有得到验证。然而,作者指出,质谱识别的潜力是很有吸引力的;当前方法涉及基于一系列测试来阐明样品物种生化特性的劳动密集型培养和处理,这需要相当长的时间和准备。基于 16S 核糖体 RNA 序列的遗传分化是可能的,也是常见的,但需要预定义的序列数据。相比之下,作者描述的方法(忽略培养时间)可以在 90 分钟左右完成,并且只需要事先建立一个蛋白质组“指纹”以进行比较。
所提出的方法围绕三个关键组成部分展开,旨在使质谱识别的使用更易获得和准确。首先,基质辅助激光解吸/电离 (MALDI) 质谱仪的使用允许通过首先将大型、通常易碎的颗粒(特别是蛋白质或 DNA 片段)固定在支撑基质上,然后用相对低能量的激光(氮基)将它们弹出,从而识别它们。该方法允许保持比一般其他质谱法允许的更大的片段,从而允许更简单的质谱数据,因此减少了对分辨率的依赖。因此,可以使用较低分辨率(因此更实惠)的质谱系统进行识别。实施的第二个变化是使用单核苷酸多态性 (SNP) 来区分蛋白质组非常相似的物种(在本研究中,区分欧洲和北美 Erwinia amylovora 菌株)。这是通过对两种菌株的 galE 基因进行测序,然后使用 PCR 使用必要的引物来扩增该序列来实现的。这导致 galE 基因的浓度放大,然后可以通过 MALDI 质谱法进行识别。通过这种方式,现在可以区分这些蛋白质组几乎完全相同的物种。第三个也是最关键的组成部分是建立一个细菌指纹数据库,以广泛使用质谱鉴定。通过对物种进行 20 次质谱数据生成,对数据进行平均以获得该物种最常见的谱图,然后可以通过统计软件将其与现场结果进行比较,以提供类似于当前用于 BLAST 搜索的方法的拟合程度结果。作者指出,该数据库可以在线免费获取,除了已经进行指纹识别的 2800 多个菌株外,预计将开展一项全球性工作,这将使该数据库快速增长,尤其是在特定领域,例如植物感染中感兴趣的物种。
在完全实施的情况下,作者的物种识别方法首先是对特定微生物物种(如病原体)进行取样,然后进行培养,既可以增加细胞数量,又可以进行纯化(最大限度地减少特定样本中分析的物种数量)。 接下来,这种培养物可以固定在 MALDI 基质上并进行测试,可能多次测试以提高置信度。 假设该物种已被指纹识别,则将所得光谱与数据库中的光谱进行统计比较,并应用最佳拟合; 如果接近度值足够高,则可以进行明确的识别。 如果该物种在蛋白质组水平上与其他细菌菌株相同,则数据库条目也将包括 SNP 分析结果,以允许进行这种额外的区分级别。
新术语
- MALDI
- 基质辅助激光解吸/电离质谱法; 质谱法。 一种方法,其中大型、脆弱的分子(如蛋白质或 DNA)通过“温和”激光(如氮气)电离,并通过基质表面支撑,使其不易碎裂。(http://www.sigmaaldrich.com/analytical-chromatography/spectroscopy/maldi-mass.html)
- SNP
- 单核苷酸多态性; DNA 序列变异,其中基因序列在一个特定核苷酸处被修饰,导致除了一个配对之外所有序列都相同。(http://en.wikipedia.org/wiki/Single_nucleotide_polymorphism)
- 稳健性
- 将细菌物种固定在载玻片或台上,通常使用热量; 在本文的情况下,是指将它们固定在支撑基质上。(http://en.wikipedia.org/wiki/Robust)
- 管家基因
- 在任何处理条件下都会表达的基因(非条件性表达)。(http://www.biology-online.org/dictionary/Housekeeping_genes)
- 树状图
- 用于说明基因聚类的树状图。(http://en.wikipedia.org/wiki/Dendrogram)
课程相关性
- 这项工作在代谢研究中具有相当大的价值,因为它通过建立包含其整个蛋白质组数据的微生物物种的“指纹”来发挥作用。 虽然这种“大图景”方法在区分物种方面似乎有效,但可以设想使用 MALDI 的质谱识别可以用来区分同一物种的不同条件; 例如,在好氧条件下与厌氧条件下的微生物之间。 此过程目前使用 SDS-PAGE 或类似方法进行,但这些方法难以自动化,而且非常耗时。 质谱法已被证明易于自动化,并且在建立方法后可以非常快地完成。
基于密度的蛋白质组学样本分级技术:叶酸缺乏引起的肝脏和脑组织氧化应激反应
[edit | edit source]Lan W, Guhaniyogi J, Horn MJ, Xia JQ, Graham B. J Biomol Tech. 2007 年 9 月 18(4): 213–225.
主要关注点
叶酸在大脑和肝脏中都很重要,使用它作为迫使大鼠患病的因素,可以识别出独特的蛋白质和潜在的生物标志物,以便在受控实验之外识别疾病。
摘要
叶酸是生物合成途径中的辅酶,对 DNA 合成、DNA 修复和各种甲基化反应至关重要。 包括人类在内的大多数哺乳动物都无法合成叶酸,必须从饮食中获取。 叶酸缺乏与中风、阿尔茨海默病、帕金森病、抑郁症、癌症和心血管疾病有关。
叶酸缺乏会破坏一碳代谢,导致高半胱氨酸水平升高,高半胱氨酸是一种细胞毒性氨基酸,会导致 DNA 链断裂、凋亡和诱导氧化应激,进而级联 DNA 损伤、改变一碳代谢并引发多种器官损伤和神经退行性疾病。 氧化应激和氧化损伤会以多种方式改变蛋白质功能,包括直接修饰催化氨基酸,改变结合或调节位点的关键氨基酸残基,以及改变蛋白水解敏感性和聚集状态。 在动物中,肝脏是叶酸储存和代谢的重要器官。 将两组各四只大鼠分别喂食叶酸定义饮食两周,然后将实验组转换为叶酸缺乏饮食。 另外四周后,收获其器官。 使用 Edge 200 分级技术根据密度将从器官中获得的蛋白质分离成 11 个样本。 分级用于提高不太普遍的蛋白质的可见度。 使用质谱法测量每个样本,以确定叶酸和指示氧化应激的生物标志物在哪些密度下出现。 在叶酸缺乏的大鼠中,与喂食含有叶酸的饮食的大鼠相比,参与控制氧化应激的蛋白质 GPx1 的丰度增加了 50% 到 70%。 叶酸缺乏引起的氧化应激在脑组织中比在肝组织中更低。 在实验大鼠中发现了与氧化应激相关的几种蛋白质。 在实验大鼠中还观察到许多功能未知或与叶酸缺乏没有已知关系的蛋白质的变化。 Western blot 结果显示每个级分中标记物相对百分比分布的变化,表明它们在细胞中的潜在易位。
新术语
- Edge 200 分级
- 非变性前端样本分级技术。 它通过将颗粒悬浮在已知密度的初始介质中来工作。 将悬浮液离心,并将上清液作为第一个样本保存。 将剩余的沉淀物重新悬浮在密度增加的介质中,并将该过程重复进行,直到获得所需的分级样本数量。
- 氧化应激
- 活性氧的产生与生物系统快速解毒活性中间体或修复由此造成的损伤的能力之间的失衡。([3] 04-12-09)
- 流行病学
- 研究影响人群健康和疾病的因素。([4] 04-12-09)
- 随意
- 拉丁语中的“随心所欲”([5] 04-12-09)
- 速冻
- 将样品浸入液氮中冷冻。([6] 04-12-09)
- 大脑周围神经系统
- 周围神经系统,位于中枢神经系统(大脑和脊髓)之外。([7] 04-12-09)
课程相关性
- 蛋白质组学中最大的问题之一是从样本中分离出特定蛋白质。 本文展示了使用 Edge 200 分级技术将样本中的所有蛋白质分离成用户指定数量的密度特定样本。
总结的网站
[edit | edit source]系统生物学
[edit | edit source]Ranish J. http://www.systemsbiology.org/technology/Data_Generation/Mass_Spectrometry_Analysis (3-20-09)
主要关注点
通过增加 PTM 的浓度,提高了使用质谱法寻找蛋白质的翻译后修饰 (PTM),这些修饰在控制广泛的生物学功能和活动中起着关键作用。
摘要
分析翻译后修饰 (PTM) 蛋白质很困难,因为修饰的蛋白质的浓度远低于未修饰的蛋白质版本,并且修饰本身是质谱法的阻碍因素。 通过提高修饰形式蛋白质的浓度,并使用专门为分析翻译后修饰肽产生的独特 MS/MS 碎裂模式而设计的计算算法,大大提高了在质谱分析过程中识别修饰肽的可能性。 富集方法包括纯化至均质和使用酰肼化学和稳定同位素标记与固体载体偶联。 正在开发进一步定义 PTM 的方法,例如; 将肽混合物甲酯化以阻止羧酸盐在后续步骤中进一步反应,并引入稳定同位素以进行定量分析、洗脱和与多胺结合。
新术语
- 翻译后修饰 (PTM)
- 蛋白质翻译后的化学修饰。 对于许多蛋白质来说,它是蛋白质生物合成中的最后一步之一。(http://en.wikipedia.org/wiki/Post_translational_modification 4-12-09)
- SUMO 化
- 一种 PTM,涉及连接或分离 **S**mall **U**biquitin-like **MO**difier 蛋白(http://en.wikipedia.org/wiki/SUMOylation 4-12-09)
- MS/MS
- 多级质谱法,在阶段之间进行某种形式的碎裂(http://en.wikipedia.org/wiki/MS/MS 4-12-09)
- 亚化学计量
- 一种数量太小而无法计算反应物和产物之间关系的量。(http://www.answers.com/topic/stoichiometry 4-12-09)
- 酰肼化学
- 涉及与共享一个共同官能团的有机化合物结合的反应,该官能团的特征在于氮与氮共价键具有 4 个取代基,其中至少有一个是酰基。 (http://en.wikipedia.org/wiki/Hydrazide 4-12-09)
课程相关性
- 蛋白质组学中的一大难题是寻找和分离浓度非常低的蛋白质。 该网站包含克服这个问题的方法。
美国国家生物技术信息中心分类数据库
[edit | edit source]http://www.ncbi.nlm.nih.gov/Taxonomy
主要关注点
建立一个广泛的、免费访问的资源,用于编目当前和未来的生物数据。
摘要
美国国家生物技术信息中心 (NCBI) 作为全球生物技术信息收集中心,以公共数据库的形式提供信息。其分类数据库 (Taxonomy) 旨在根据合作数据尽可能保持最新状态,以反映当前对各种生物体的分类。由于数据是由各种独立研究机构生成的,因此将这些数据提交到 NCBI 网站对作者有以下两方面的益处:通过与已发布的和即将发布的数据进行比较来确认其工作,以及将其公开以便引用。
对于整个科学界而言,NCBI 网站只是众多尝试公开并使每年大量涌现的科学数据可访问和可搜索的尝试之一。所有领域都受益于轻松获取相关数据,但在生物学领域尤其明显,随着新方法的验证和应用,该领域不断积累新的数据。已知生物体的数量巨大,加上分析方法的不断改进,确保了总会有无限的数据需要收集,包括新发现和以前研究过的物种和系统。此外,随着全球大部分地区的教育和经济状况不断改善,产生数据的个人机构数量也不断增加。这种数据涌入在过去几个世纪的方法中无法有效存档;单个基因组将填满整个卷,即使这些还需要定期更新,印刷频率也需要每年不止一次。最重要的是,这些数据在成本和搜索方面都难以访问。单一程序通常需要使用来自数十到数百个来源收集的数据,这将使查找这些信息变得极其困难,而且许多数据(例如蛋白质或 DNA 序列比较)需要比较数千个数据点(碱基对),这使得计算机应用成为绝对必要。
出于所有这些原因,NCBI 分类网站 (Taxonomy) 应运而生,并迅速成为生物学及相关研究的宝贵资源。该网站允许搜索任何已知和存档的物种,并为每个物种提供当前可用作品的表格汇总,例如基因组序列或项目、已知的蛋白质和/或其他生化结构,甚至在 PubMed 数据库中引用特定物种的次数。更重要的是,所有这些参考资料和数据点都相互链接,允许在瞬间访问海量数据。可以肯定地说,如果没有 NCBI 和其他公共数据库,我们最近许多生物学和生物化学突破将需要更长时间,甚至可能根本无法实现。
新术语
- GEO
- 基因表达综合 (Gene Expression Omnibus);一个基于 NCBI 的公共数据库,包含微阵列和 ChIP-chip 数据。 (http://www.ncbi.nlm.nih.gov/geo/)
- ChIP-chip
- 芯片上的染色质免疫沉淀 (ChiP-on-chip);一种用于观察 DNA 与 DNA 结合蛋白之间相互作用的微阵列方法。 (http://www.chiponchip.org/)
- PopSet
- 已测序的 DNA 集合,用于对种群的进化相似性进行统计比较。 (http://www.ncbi.nlm.nih.gov/sites/entrez?db=popset)
- SRA
- 短读存档 (Short Read Archive);用于存储来自特定生物体的 DNA 不完整序列的存档,通常每个序列包含数百万个碱基对。 (http://www.ncbi.nlm.nih.gov/sites/entrez?db=sra&cmd=Search&dopt=DocSum&term=txid562[生物体:实验])
- HomoloGene
- 自动基因同源物检测系统;将序列数据与已完成的真核生物基因组进行比较,以检测共享的基因特征。 (http://www.ncbi.nlm.nih.gov/homologene)
课程相关性
在生物学不断发展壮大的今天,像 NCBI 分类网站这样的网站的价值无法过分强调,这不仅体现在其在研究方面的实用性,也体现在其重要的档案功能。