蛋白质组学/蛋白质一级结构/测序方法
本节
蛋白质测序指的是确定蛋白质的氨基酸序列或一级结构的过程。测序在蛋白质组学中起着至关重要的作用,因为获得的信息可用于推断功能、结构和位置,进而有助于识别新的或新颖的蛋白质以及理解细胞过程。更好地理解这些过程有助于创造靶向特定代谢途径等药物。
尽管存在几种测序蛋白质的方法,但两种主要方法是质谱法和Edman降解。其他不常用但仍然可以发挥非常特定作用的方法,例如克服不足或作为补充两种主要方法的初步步骤。
蛋白质测序的出现可以追溯到弗雷德里克·桑格和佩尔·埃德曼几乎同时做出的两项发现。
佩尔·埃德曼于1947年开始在洛克菲勒医学研究所普林斯顿分部的诺斯罗普-库尼茨实验室工作,在那里他试图找到一种使用化学物质解码蛋白质氨基酸序列的方法;具体来说,他早期使用氟二硝基苯(FDNB)和苯异硫氰酸酯(PITC)取得了成功。在普林斯顿的一年里,埃德曼能够进行足够的实验来理解使用FDNB和PITC等试剂确定氨基酸序列是可行的。埃德曼于1947年返回瑞典,并在经过两年的工作后,他发表了他的论文,该论文描述了第一种成功测序蛋白质的方法[1]。这篇开创性的论文描述了一种确定蛋白质氨基酸序列的方法,并最终被称为Edman降解。
五年前,弗雷德里克·桑格已经证明了一种使用试剂氟二硝基苯确定多肽链N端氨基酸残基的方法。虽然人们认为这种方法最多只能提供N端发现的序列,但桑格能够将这种方法更进一步。通过使用几种蛋白水解酶、部分水解和早期的色谱方法,桑格能够将蛋白质裂解成片段并将残基像拼图一样拼凑起来。直到1955年,桑格才能够展示胰岛素的完整序列,这使他于1958年获得了诺贝尔化学奖。
质谱法作为分析单个分子的工具,在桑格或埃德曼开始蛋白质测序工作之前就已经存在了许多年。从19世纪末的早期开始,它的硬件和软件都发生了许多变化,并且已被证明对测序领域至关重要,因此有更多诺贝尔奖颁发给了能够改进这项技术的人。尽管它在今天很重要,但直到1966年,K. Biemann、C. Cone、B.R. Webster和G.P. Arsenault测序了几个包含甘氨酸、丙氨酸、丝氨酸、脯氨酸和几个其他氨基酸的寡肽[2],质谱法的意义才被充分认识。20世纪80年代后期出现了进一步的发展,质谱仪成为实验室中更强大的仪器。1989年首次展示了快速原子轰击电离与串联质谱联用在蛋白质序列鉴定中的应用。这项工作是20世纪90年代初开始使用的蛋白质质量指纹图谱程序的早期基础。随着MALDI和电喷雾电离作为两种新的电离方法的出现,质谱法的动态范围得到了极大的改善,为质谱仪成为蛋白质测序中的主要工具铺平了道路。1996年蛋白质组学的出现见证了许多快速发展,如计算能力的提高、万维网和蛋白质数据库的发展以及质谱多四极杆系统的发展,使MALDI-MS/MS和其他串联质谱法成为可能[3]。
N端残基鉴定包括一种化学确定哪个氨基酸形成肽链的N端的技术。此信息可用于帮助排序使用其他测序技术生成的单个肽序列,这些技术会使肽链断裂。通常,第一轮Edman降解还将包含可能使N端残基鉴定变得困难的杂质。下面描述了N端残基鉴定的通用过程[4]
- 使用将选择性标记末端氨基酸的试剂标记游离的未质子化的α-氨基。可以实现此目的的试剂包括2,4-二硝基氟苯(DFNB - Sanger试剂)、丹酰氯和苯异硫氰酸酯(Edman试剂)。
- 用酸水解标记的肽,产生N端残基和其他游离氨基酸。
- 可以使用色谱法分离和鉴定每个这些衍生的N端残基。
这些方法可用于鉴定肽的N端残基。这是一个耗时的过程,现在效率更高的测序技术可用,因此其用途有所减少。使问题进一步复杂化的是:过程中使用的某些试剂还可以降解氨基酸残基,直至它们无法识别。在可用于标记N端残基的试剂中,由于其高荧光性质,丹酰氯比FDNB灵敏约100倍,这使其在微量情况下易于检测。Edman试剂的使用也是有利的,因为它使肽链中剩余的残基不受影响,如下一节所述。
Edman降解方法基于以下原理:单个氨基酸残基可以被化学修饰,以便在不破坏任何其他残基之间键的情况下从链上裂解[5]。该程序可以使用非常少量的肽来实现,通常大约10-100皮摩尔的量将允许成功完成。样品必须只包含一种蛋白质成分,并且应不含任何干扰降解过程的试剂,例如甘氨酸、甘油、蔗糖、胍、乙醇胺、硫酸铵和铵盐。下面描述了通用方法[6][7]
- 要测序的肽首先必须通过吸收到化学修饰的玻璃上或通过电印迹到多孔聚偏二氟乙烯(PVDF)膜上进行固定。
- 在弱碱性条件下,苯异硫氰酸酯(PITC)与氨基酸链上的未带电荷的末端基团反应,形成苯硫氨基甲酰衍生物。
- 然后,使用三氟乙酸裂解该苯硫代氨甲酰衍生物,生成其苯胺基噻唑啉酮衍生物(ATZ-氨基酸)。下一个末端氨基酸现在暴露出来,并准备好发生相同的反应。
- 进行洗涤以去除多余的缓冲液和试剂,并用乙酸乙酯选择性地提取ATZ氨基酸,并将其转化为更稳定的苯硫代腙(PTH)-氨基酸衍生物。
- 使用色谱法或电泳法鉴定PTH氨基酸衍生物。
- 现在可以对链的其余残基重复此过程。
Edman降解程序的自动化始于1967年[8],并且由于其灵敏度和快速完成而继续成为一种有利的测序方法。可以自动化Edman降解程序的测序仪包括Applied Biosystems Procise或Protein Sequencer系列的许多型号。
该程序的主要缺点仍然是肽链的长度。如果链的长度超过50-60个残基(实际上为30个残基),则由于循环衍生化的不完整,该程序往往会失败。这可以通过获取较大的肽链并使用氰化溴、胰蛋白酶、糜蛋白酶或任何可以断裂肽链的酶/化学物质将其裂解成较小的片段来解决。
由于其易于自动化和极高的准确性,质谱法正迅速成为识别蛋白质序列的金标准。现在,使用质谱法测序蛋白质的过程占主导地位。使用质谱法识别蛋白质序列的两种最流行的方法是
1. 肽质量指纹图谱 2. 串联质谱法
这种方法也称为蛋白质指纹图谱,由几个小组于1993年开发。将未知蛋白质裂解成较小的片段,以便可以使用质谱仪准确测量这些较小的片段。下面显示了广义程序:1. 蛋白质样品被蛋白水解酶分解成几个较小的肽片段。2. 使用乙腈提取所得片段,并通过真空干燥。然后将肽溶解在蒸馏水中,准备进行分析。3. 然后将肽插入质谱仪(如ESI-TOF)的真空室中。质谱仪生成一个峰列表(即分子量的列表),然后将其与SwissProt或GeneBank等数据库进行比较以查找匹配项。软件用于将检索到的基因组数据翻译成蛋白质,然后通过与用于裂解未知蛋白质相同的酶进行模拟裂解。计算这些片段的质量,然后与未知蛋白质的质量进行比较。
串联质谱法描述了将质谱法划分为单独步骤的过程,其中这些步骤之间发生碎片化。这些分离可以通过空间中的物理分离(通过称为四极杆的单独腔室)、使用多个质谱仪或通过单个质谱仪的时间来实现。下面描述了广义程序,1. 目标蛋白的酶促或化学降解以产生肽。2. 通过高效液相色谱分离肽。3. 将所得片段送入质谱仪进行分析。
串联质谱法的片段分析发生在两个或多个四极杆系统中,第一个四极杆过滤选择将进行进一步分析的离子。这些过滤后的离子被转移到第二个四极杆,第二个四极杆充当碰撞中心,以在酰胺键处诱导进一步的片段化。然后使用第三个四极杆按质量分离这些片段。串联质谱法主要产生N-端和C-端类型的肽,这些肽通过质量/电荷与强度图在二维上表示。质谱仪产生的包含所有片段分子量的谱图称为肽图,可以作为识别质谱仪分析的蛋白质的一种手段。识别蛋白质序列的其他方法包括蛋白质序列标签和从头方法。
- ↑ Morgan, F.J. "AAS传记回忆录 - Pehr Victor Edman 1916 - 1977。" 1998年4月8日。墨尔本大学。2008年3月30日访问。<http://www.asap.unimelb.edu.au/bsparcs/aasmemoirs/edman.htm>。
- ↑ Biemann K., Cone C., Webster B.R., Arsenault G.P. 通过计算机解释其高分辨率质谱确定寡肽中的氨基酸序列 J. Am. Chem. Soc.,1966,88(23),第5598-606页。PMID:5980176。在线提供全文。
- ↑ Henzel W.J.,Watanabe C.,Stults J.T. 蛋白质鉴定:肽质量指纹图谱的起源。美国质谱学会杂志,2003,14(),第931页 在线提供全文
- ↑ Bhagavan,N. V.(2001)医学生物化学(Harcourt Academic,圣地亚哥)。在线提供全文
- ↑ http://en.wikipedia.org/wiki/Edman_degradation
- ↑ Lottspeich,Friedrich。“Edman测序。”马克斯·普朗克生物化学研究所。2008年3月30日访问。<http://wwwa2.udic.org/en/rg/lottspeich/technologies/edman_sequenzing/absatz_2_edman_degradation.pdf>。
- ↑ Edwards,Adam。“亚当·爱德华兹的蛋白质测序。” 1999年12月6日。山福德大学。2008年3月30日访问。<http://faculty.samford.edu/~gekeller/edwards.html>。
- ↑ 自动Edman降解:蛋白质测序仪。 Methods Enzymol. 1973,27,942-1010。