基因工程

基因工程指的是对活生物体的基因组进行靶向、特异性修饰的策略和技术。

早期的基因工程方法只涉及使用同源重组来修饰遗传序列。使用位于另一条链上的同源序列作为模型可以引导这种自然的DNA修复机制来修复DNA链。可以使用载体（如修饰后的逆转录病毒基因组）将外源DNA链插入细胞中，从而诱导细胞DNA链与外源DNA链之间的同源重组。重组现象具有足够的灵活性，可以对目标同源区域引入一定程度的改变（添加、抑制或修饰DNA部分）。

在进行进一步的开发以提高体细胞类型中同源重组率之前，仅使用同源重组来修饰基因组仍然是一个漫长且随机的过程。这些开发包括使用定点内切核酸酶，它们通过引起双链DNA断裂来实现基因修饰，从而触发细胞的自然DNA修复机制，主要是非同源末端连接（NHEJ）以及低频的同源重组（HR）。

分子生物学中常用的限制性内切酶与1至10个核苷酸的序列相互作用。这些序列非常短，通常是回文序列，在基因组中通常会出现在多个位点（人类基因组包含64亿个碱基）。因此，限制性内切酶很可能在多个位点切割DNA分子。因此，在努力寻找更精确、更安全的基因组手术方法时，科学家们转向了更精确的工具。

通过使用能够识别和与足够长的DNA序列相互作用的酶，可以进行更靶向的基因组工程，这些序列在任何给定的基因组中可能只出现一次，具有很高的概率。因此，DNA修饰精确地发生在靶序列位点。巨核酸酶和锌指核酸酶的识别位点超过12个碱基对，提供了这种精确度。

一旦DNA被切割，自然的DNA修复机制和同源重组就可以使修饰后的序列或新基因整合进去。

这些不同阶段（识别、切割和重组）的成功取决于各种因素，包括将酶导入细胞的载体的效率、酶切割活性、细胞的同源重组能力，以及可能在给定基因座处的染色质状态。

基于巨核酸酶的工程

巨核酸酶于20世纪80年代后期被发现，是内切核酸酶家族中的酶，其特点是能够识别和切割大型DNA序列（从12到40个碱基对）。最广泛和最著名的巨核酸酶是LAGLIDADG家族中的蛋白质，它们的名字来源于一个保守的氨基酸序列。

20世纪90年代，这些酶被确定为基因工程的有希望的工具。然而，即使它们存在于自然界中，并且每个酶在其DNA识别位点都表现出轻微的变化，但几乎没有机会找到能够作用于特定DNA序列的精确巨核酸酶。因此，每个新的基因工程目标都需要一个初始的蛋白质工程阶段，以产生定制的巨核酸酶。

有两种方法可以创建定制的巨核酸酶

诱变涉及使用具有类似于所需酶的性质的巨核酸酶产生变异体集合，然后使用高通量筛选来选择这些变异体。该过程可以通过采用所谓的“半理性”方法来优化，其中结构数据被电子处理，以便将诱变集中在酶与DNA相互作用并触发切割的部分。
组合装配是一种方法，通过该方法，来自不同酶的蛋白质亚基可以被关联或融合。

这两种方法可以结合使用。已经创建了一个包含数万个蛋白质单元的大型库。这些单元可以组合起来，以获得识别靶位点的嵌合巨核酸酶。这种技术已经使开发了针对病毒、植物等基因组中序列的几种特异性巨核酸酶成为可能。

基于锌指核酸酶的工程

锌指基序出现在几种转录因子中。锌离子存在于所有人类蛋白质的8%，在它们的三维结构的组织中起着重要作用。在转录因子中，它最常位于蛋白质-DNA相互作用位点，在那里它稳定基序。每个指的C端负责特定识别DNA序列。

识别的序列很短，大约由3个碱基对组成，但通过结合6到8个识别位点已被表征的锌指，可以获得针对大约20个碱基对的序列的特异性蛋白质。因此，可以控制特定基因的表达。也可以将以这种方式构建的蛋白质与内切核酸酶的催化结构域融合，以诱导靶向的DNA断裂，因此可以使用这些蛋白质作为基因工程工具。

通常采用的一种方法涉及将两种蛋白质（每种蛋白质包含3到6个特定选择的锌指）与FokI内切核酸酶的催化结构域关联。这两种蛋白质识别彼此相距几个核苷酸的两个DNA序列。将两个锌指蛋白与其各自的序列连接在一起，使与它们相关的两个内切核酸酶更加接近。这意味着它们可以二聚化，然后切割DNA分子。

使用了几种方法来设计针对选定序列的特异性锌指核酸酶。最广泛的方法是将具有已知特异性的锌指单元结合起来（模块化组装）。已经开发出各种选择技术，使用细菌、酵母或哺乳动物细胞，来识别提供最佳特异性和最佳细胞耐受性的组合。

TALENs

转录激活样效应因子核酸酶（TALENs）是由将特异性DNA结合结构域融合到通用DNA切割结构域而产生的合成限制性内切酶。可以设计为结合任何所需DNA序列的DNA结合结构域来自TAL效应因子，TAL效应因子是由感染植物的某些细菌分泌的DNA结合蛋白。TALENs的使用方式类似于设计的锌指核酸酶。

CRISPR/Cas

CRISPR（成簇的规律间隔的短回文重复序列）是细菌用作一种获得性免疫来抵御病毒的遗传元件。它们由源自病毒基因组的短序列组成，并已整合到细菌基因组中。Cas（CRISPR相关）蛋白处理这些序列并切割匹配的病毒DNA序列。通过将包含Cas基因和特异性构建的CRISPR的质粒引入真核细胞，基因组可以在任何所需的位置被切割。

CRISPR/Cas9系统自2013年以来彻底改变了基因工程领域。使用CRISPR编辑基因组涉及表达RNA引导的Cas9内切核酸酶，以及引导RNA，将其引导到要编辑的特定靶序列进行切割。当Cas9切割靶序列时，细胞被诱导通过用研究人员提供的改变版本替换原始序列来修复损伤。由于制作引导RNA以引导Cas9切割任何基因非常简单，因此CRISPR极大地简化了删除、添加或修饰基因的过程。截至2014年，它已成功在包括人类细胞在内的20种物种中进行了测试。在这些物种中，许多物种的编辑是在产生精子或卵子的细胞中完成的，使它们能够被后代遗传。