克隆方法

2024-11-29 11:00:01 268次浏览

克隆方法
【专利摘要】本发明涉及用于制备两种或更多种标准化的表达盒的方法，所述方法包括：a.提供两组或更多组元件序列，每组元件序列一起构成至少一种功能性表达盒，各元件序列两侧侧翼为IIs型限制内切酶切割位点，之后是其识别位点，所述IIs型限制内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒；b.提供至少两种骨架进入载体，各骨架进入载体按以下这种顺序包含：(i)限制酶切割位点与其识别位点，和第一连接物序列(LF)；(ii)包含可选择标记基因的载体骨架；以及(iii)第二连接物序列(RF)，和限制酶识别位点与其切割序列；以及(iv)任选地，在(i)和(iii)的识别位点之间的插入物，任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列组装；以及c.使用基于经由所述切割位点使用限制酶消化和连接的方法，在至少两种骨架进入载体中组装所述两组或更多组元件序列作为功能性表达盒，从而制备两种或更多种标准化的表达盒。
【专利说明】克隆方法

【技术领域】
[0001] 本发明涉及用于制备标准化的表达盒的方法。本发明还涉及用于在宿主细胞中体内重组所述标准化的表达盒的方法。另外，本发明涉及用于将核酸序列整合在靶位点 (target locus)的方法。本发明还涉及用于制备标准化的表达盒的系统，以及用于产生整合在靶位点的目的核酸构建体的系统。

【背景技术】
[0002] 现代生物技术应用遗传改造来研发具有新型表型的以供在基于生物的转化过程中使用的生物体，所述转化过程应用在食品、饲料（feed)、医药、材料以及能源方面。这包括设计和产生正常情况下不会在目的生产宿主中发现或（在已知情况下）完全非天然的新型表型。应用的实例包括（但不限于）微生物产生化学前体、工业酶、抗生素以及生物燃料。
[0003] 需要新型技术来设计更好、构筑更快且测试更多的DNA构建体，以用于更快并且更佳的菌株改造。这可以通过DNA构建的标准化、模块化以及自动化来着手进行。另外，再利用现有的元件或所谓的生物砖（biobrick)的能力将有助于更好地表征这些元件和降低构建体合成和/或组装的成本。所述生物砖可为例如启动子（P)、5'UTR(U)、信号序列（S)、开放阅读框架（〇)、基因组序列（G)、终止子（T)以及其它功能或调节DNA元件。
[0004] 科学家正仔细调查生物和改造工具来研发用于改造细胞的新型方法。复杂DNA盒可以被设计并且被需要来使改造细胞用于新型目的和高效的转化。因此，需要研发高通量低成本的DNA组装方法，以用于实际处理和探索更大组的设计。所需要的DNA盒可通过基因合成和连接来产生。然而，这通常是必需针对每种构建体进行重复的高成本的过程。已经提出再利用DNA构筑块和模块式盒来减少成本和时间。因此，对于基因组合的最佳使用和探索以及代谢途径的调谐（又称为合成生物学）来说，需要研发物理地组装含有大量呈多种排布的天然或人工基因的复杂DNA分子的新型方法。对于DNA盒的模块式构建来说，需要使用基本构筑块来物理组装和构筑这些盒的有效方法。当前可用的用于组装表达盒的方法由 Wang T 等人（2012)于 Appl Microbiol Biotechnol (2012)93 :1853-1863 进行综述，并且包括如 Goldenfcaid(Sarrion-Perdigones A. (2012)，PL〇S ONE 6(7) :e21622)和模块克隆（Modular Cloning) (Weber Ε· (2011)，PLoS ONE 6(2) :el6765 以及 EP2395087)。
[0005] 然而，这些方法相当复杂，因为其包括连续的体外步骤或反复的重组（Wingler LM(2011)PNAS USA 108(37) :15135-15140)来用于体内组装多基因途径的文库。
[0006] 虽然在过去的数年已经取得很大进展，但大的重组DNA分子的物理构建仍代表着对于每种应用来说都尚没有适合解决方案的主要瓶颈（Weber E. (2011)，PLoS ONE 6(2): el6765以及EP2395087)。重组DNA分子传统上使用II型限制酶和连接酶来构建。虽然极为通用，但这种方法缓慢且冗长，并且仅允许产生相对小尺寸且仅含有数个基因的构建体。具体来说，这种方法受到以下事实的限制：对于大的构建体来说，设计克隆策略变得极其困难，因为所有可用的限制酶将在所述构建体中切割许多次。在过去的数年中，已经研发许多不同的方法来克服这些限制。这些方法包括基于重组酶的克隆、不依赖连接的克隆、基于同源重组和基于PCR组装的克隆。基于重组酶的克隆消除了来自限制位点多次出现在大的构建体中的问题，但受以下事实限制：重组位点留在最终的构建体中，从而妨碍蛋白质编码序列的无缝组装（Weber E. (2011)，PLoS ONE 6(2) :e 16765 以及 EP2395087)。此外，基于重组酶的克隆受以下事实限制：迄今为止，仅4个片段可同时在一个构建体中组装。
[0007] 尽管所有这些技术具有其自身的优势，并且对于特定应用来说极其有用，但无一满足产生多遗传变体组合的任务所需的所有要求，所述多遗传变异组合的产生是成功设计和构建具有新型表型的生物体所需的。
[0008] 用于DNA构建体组装的方法由Wang等人于2012年描述。多组分蛋白复合体的结构生物学、代谢工程学以及合成生物学的研究经常依赖于这些亚单元或酶在同一细胞中的有效过度表达。作为第一步，如果使用基于经典且常规的消化和连接的克隆方法，构建多个表达盒将为复杂且耗时的工作。已经研发了一些更有效的方法，包括（1)采用多相容质粒表达系统；（2)载体的基于稀有切点的设计（rare-cutter-based design) ; (3)体外重组（不依赖于序列和连接的克隆，DNA分子在单一反应中的等温酶促组装）；以及（4)使用有效重组的酵母进行体内重组（体内组装重叠片段，反复重组用于外源表达盒的染色体整合）。
[0009] 最近，已经研发基于IIs型限制酶的克隆方法（(W0 2008/095927)，Engler等人.PLoS ONE 4(2009)e5553)描述了使用IIs型限制酶通过使10个未消化的输入质粒的混合物简单地经受限制-连接反应并且将所得混合物转化到感受态细胞中，一步并且在一个管中将至少九个独立的DNA片段一起组装到受体载体中的方案。这种方案称为"Golden Gate"克隆。
[0010] 虽然合成生物学代表一个新的领域，但它利用遗传改造，并且因此应从现有成熟的技术如机械工程学来习得。复杂装置的成功工程化的重要考虑因素包括部件的标准化。对于合成生物学来说，标准化将允许从一个项目到下一个项目随意地再利用先前验证的模块，并且因此使得更有效地改造新生物学功能或生物体。标准化的一个重要方面在于可将预定值与各部分相关联，例如，启动子的限定活性（但应理解启动子活性可受附近序列中存在的增强子序列影响）或针对给定多肽的比酶活性。这是极为重要的，因为改造新功能或生物体将需要如此大量的部分一起工作，这样使得将需要针对许多项目进行测试的基因组合的数量有可能过大而在物理上不可能。这个要素是实现合成生物学的可能性所需要的必要要素。

【发明内容】

[0011] 我们已经研发了一种体外/体内杂合方法，所述方法应用标准化的生物元件经由中间 Golden Gate 组装步骤（Engler C. (2008) PLoS ONE 3(11) :e3647)形成复杂 DNA 盒用于在目的宿主中进行表达，并且应用专门设计的用于在标准化的盒组装中进一步使用的进入载体（entry vector) 〇
[0012] 使用这种新型有效两步法允许以高效的方式构建模块式DNA盒。另外，我们已经研发并且显示了测量启动子强度的小型途径表征法（mini-pathway characterization method)，其包括两个内部参照测量（参见实施例1)。在所述实施例中，GFP、LacZ以及RFP 组合到一个途径中。所述方法还应用来表征终止子序列，并且可类似地用于表征信号序列， 5' UTR或感兴趣的任何其它调节部分或突变、插入或缺失。
[0013] 基于同源重组的方法是有用的，但要求模块之间共有最少量的序列，这限制了自由组合不同序列的标准模块的能力。然而，本发明的方法通过使用约9 bp(或更长）的标准化的连接物元件来用于体外组装或约25 bp (或更长）的标准化的连接物元件来用于体内组装，规避了这个问题。两种方法均可应用来组装表达盒，或研发敲除或插入序列，如下文中所解释的。此外，通过在连接物序列处有效使用利用标准化的引物的PCR法，可从含有标准化的连接物序列的骨架盒有效地回收模块式盒。连接物序列可含有IIS型限制酶识别位点，以在所要求位置处在所进行的步骤中进行准确切割，从而允许无缝体内同源重组，如果需要无缝体内同源重组来维持或恢复DNA构建体的功能性的话。
[0014] 因此，本发明提供核酸分子的系统，所述系统可用于由期望数目优选至少3个片段来体内组装目的核酸盒，并且整合在靶位点处，其中至少一个片段含有功能性表达元件。功能性表达元件含有（但不限于）启动子DNA序列（pro)、开放阅读框架DNA序列（orf)、终止子DNA序列（ter)以及称为连接物（connector)的用于体内组装的左和右侧翼DNA序列（分别为Icon和rcon)。
[0015] DNA分子的系统含有一组至少2个或3个骨架（bbn)进入载体，其被设计成在进入载体中具有至少一个Icon和一个rcon序列，其可与元件载体一起应用在单锅（one-pot) Golden-Gate组装反应中，以产生功能性表达元件（Μ)和单一 II型限制酶按功能性顺序的使用 ° 例如，lcon-pr〇-〇rf-ter_rcon〇
[0016] 所述系统应可针对目的核酸构建体从许多表达元件的组装进行缩放，而同时避免对构建与构成目的核酸盒的片段或表达元件的数量一样多的骨架载体的需要。
[0017] 本发明的核酸分子的系统允许组装数量比系统中所存在的骨架载体的数量少的表达元件，以及数量比系统中所存在的骨架载体的数量高的表达元件。本发明提供一种标准化的连接物核酸分子的系统，其可用于由期望数量的表达元件组装任何目的核酸盒。
[0018] 因此，本发明提供用于制备两种或更多种标准化的表达盒的方法，所述方法包括：
[0019] a.提供两组或更多组元件序列，
[0020] 每组元件序列一起构成至少一种功能性表达盒，
[0021] 各元件序列的两侧侧翼为IIS型限制核酸内切酶切割位点，之后是其识别位点，
[0022] 所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒；
[0023] b.提供至少两种骨架进入载体，
[0024] 各骨架进入载体按以下这种顺序包含：⑴限制酶与其识别位点，和第一连接物序列（LF) ;(ii)包含可选择标记基因的载体骨架；以及（iii)第二连接物序列（RF)，和限制酶识别位点与其切割序列；以及（iv)任选地，在（i)和（iii)的识别位点之间的插入物 (insert)，
[0025] 任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装；
[0026] 以及
[0027] c.使用基于经由切割位点使用限制酶消化和连接的方法，在所述至少两种骨架进入载体中组装两组或更多组元件序列作为功能性表达盒，
[0028] 从而制备两种或更多种标准化的表达盒。
[0029] 本发明还提供：
[0030] 用于在宿主细胞中在靶位点处体内重组两种或更多种标准化的表达盒的方法，所述方法包括：
[0031] a.根据以上所述的方法制备两种或更多种标准化的表达盒，其中：
[0032] i. RF和LF连接物序列包含同源重组序列；以及
[0033] ii.任何骨架进入载体上的RF和LF序列被选择成使得其可通过体内重组分别与 LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及
[0034] b.从包含LF和RF序列的骨架进入载体回收表达盒；以及
[0035] c.在宿主细胞中在靶位点处将所回收的表达盒彼此体内重组；和
[0036] 用于在宿主细胞中在靶位点处将两种或更多种标准化的表达盒体内重组的方法，所述方法包括：
[0037] a.根据以上所述的方法制备两种或更多种标准化的模块式（modular)表达盒，其中：
[0038] i. RF和LF连接物序列包含至少9个碱基对的同源序列；以及
[0039] ii.任何骨架进入载体上的RF和LF序列被选择成使得其可使用这些序列通过体外方法分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及
[0040] b.从通过LF和RF序列体外连接的骨架进入载体组装并且回收表达盒；以及
[0041] c.在宿主细胞中在靶位点处将所回收和组装的表达盒体内重组。
[0042] 本发明进一步提供：
[0043] 用于制备两种或更多种标准化的表达盒的系统，所述系统包括：
[0044] a.两组或更多组元件序列，
[0045] 每组元件序列一起构成至少一种功能性表达盒，
[0046] 各元件序列两侧侧翼为IIs型限制核酸内切酶切割位点，之后是其识别位点，
[0047] 所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒；
[0048] b.至少两种骨架进入载体，
[0049] 各骨架进入载体按以下这种顺序包含：（i)限制酶与其识别位点，和第一连接物序列（LF) ;(ii)包含可选择标记基因的载体骨架；以及（iii)第二连接物序列（RF)，和限制酶识别位点与其切割序列；以及（iv)任选地，在（i)和（iii)的识别位点之间的插入物，
[0050] 任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装；
[0051] 和
[0052] 用于产生整合在靶位点处的目的核酸构建体的系统，所述系统包含：
[0053] a.如以上所述的系统；以及
[0054] b.至少两种整合序列，其中一种与第一表达盒和靶位点的侧翼序列重组，并且其中第二种与第二表达盒和靶位点另一侧的侧翼序列重组。

【专利附图】

【附图说明】
[0055] 图1提供用于产生目的核酸构建体的2步克隆和转化系统的概况。水平0:制备或可获得在适合的载体中的一组的元件序列，其具有IIs型限制核酸内切酶识别位点和标准化的切割位点（优选4-bp)，所述位点被选择成使得在使用Golden gate克隆组装后，形成功能性表达盒。在水平〇,还制备或可获得一组骨架载体，其含有适于使用序列同源性进行组装的左和右连接物序列，以用于在水平2组装模块式盒。选择元件序列的亚组与骨架 (bbn)载体。在水平1，使用Golden Gate克隆将它们进行组装，从而产生含有至少一起编码启动子、orf以及终止子的序列的功能性表达盒。还可选择用于在水平2在靶位点处进行整合的左和右侧翼，并且添加左或右连接物序列或左和右连接物序列二者。例如，经由在适合的bbn载体中进行克隆或经由PCR反应，其中con序列为所使用的引物的一部分。水在适合的宿主细胞中发生功能性表达盒与整合侧翼（int)和含有用于体内组装的连接物（con)序列的可能的其它DNA序列的体内组装并且在靶位点处重组。通常地，待组装的所有DNA部分可通过PCR反应从由水平1得到的载体中回收，以供在水平2使用，或例如使用经由第二适合的IIs限制酶以及其设计在con载体外侧的识别位点切出这些片段并且切割在其间包含DNA序列的con载体的方法。
[0056] 选项A与B提供用于在靶位点处组装模块式盒的方案。在选项B中，添加另外的左和右整合位点用于第二宿主。选项B之后是水平3。水平3 :例如经由PCR反应或其它方法从2B回收模块式盒（或部分）。所回收的DNA用于转化，并且随后在第二宿主在靶位点处整合模块式DNA盒。
[0057] 图2提供用于产生目的核酸构建体的2步克隆和转化系统的概况。水平0:制备或可获得在适合的载体中的一组元件序列，其具有IIs型限制核酸内切酶识别位点和标准化的切割位点（优选4-bp)，所述位点被选择成使得在使用Golden gate克隆组装后，形成功能性表达盒。在水平〇,还制备或可获得一组骨架载体，其含有适于使用序列同源性进行组装的左和右连接物序列，以用于在水平2组装模块式盒。选择元件序列的亚组连同骨架 (bbn)载体。在水平1，使用Golden Gate克隆将它们进行组装，从而产生含有至少一起编码启动子、orf以及终止子的序列的功能性表达盒。还可选择用于在水平2步骤b在靶位点处进行整合的左和右侧翼，并且添加左或右连接物序列或者左和右连接物序列二者。例如，经由在适合的bbn载体中进行克隆或经由PCR反应，其中con序列为所使用的引物的一部分。
[0058] 通常地，待组装的所有DNA部分可通过PCR反应从由水平1得到的载体中回收，以供在水平2步骤a中使用，或例如使用经由第二适合的IIs限制酶以及其设计在con载体外侧的识别位点切出这些片段并且切割在其间包含DNA序列的con载体的方法。
[0059] 水平2步骤a :使用体外组装反应例如吉布森(Gibson)克隆将一个或更多个功能性表达盒和/或整合侧翼与连接物序列组装在一起，以形成模块式盒。接下来在水平2步骤 h :在适合的宿主细胞中发生包括单独的或已经作为模块式盒的模块式盒、整合侧翼（int) 以及含有用于体内组装的连接物（con)序列的可能的其它DNA序列的体内组装并且在靶位点处重组。选项A与B提供用于在靶位点处组装模块式盒的方案。在选项B中，添加另外的左和右整合位点用于第二宿主。选项B之后是水平3。水平3 :例如经由PCR反应或其它方法从2B回收模块式盒（或部分）。所回收的DNA用于转化，并且随后在第二宿主在靶位点处整合模块式DNA盒。
[0060] 图3示出水平1的组装选项（但不限于这些），其中第iii项为使用优选地单一 IIS型核酸内切酶和4 bp伸出序列（overhang)在切割和连接后组装功能性表达盒的优选方法。ii.示出开放阅读框架可分开成信号序列和开放阅读框架的独立部分，或i.以及开放阅读框架为多个片段的形式，这例如是由于蛋白质的大小或模块式特征，例如具有独立的结构域的酶像PKS、NRPS、纤维素等，或仅仅由于大小或出于蛋白质改造目的，以产生orf 部分的文库序列。第iv项不出orf分开成3片。第v项不出启动子中分开成这样的启动子，其中单独添加基因的5' UTR部分。应注意，这些为实例，并且基本上可设计以多部分的形式分开的DNA序列并且使用IIs型系统连接，以产生无痕的DNA序列。在所示情况下，在蛋白质的蛋氣fe起点使用AATG。此处，启动子序列的最后个核昔fe始终被修饰为A。选择TAAA来桥接终止子，其中基因的终止密码子被修饰为TAA，并且终止子序列的第一位被修饰为A修饰或在5'延伸A。应注意，为有效使用Golden Gate (或其它依赖于IIS型的克隆系统），优选（使得）所有序列不含用于切割的限制酶的识别位点。
[0061] 图4针对骨架（bbn)载体变体的连接物（con)部分示出这些载体。第v项示出通常地应用来在水平1 (图1和图2)用指定的（但不限于）给定4 bp连接物产生功能性表达盒的变体。第iv项和第ii项提供bbn载体变体，其中连接物中的一个被分别用于在革巴位点处进行整合的左和右整合侧翼置换或与其组合。第ii项和第i项为变体，其中仅左或右连接物为骨架的一部分。这些通常地为仅可用在模块式盒的末端的，例如以与整合侧翼一起使用，并且在载体中储存这些。第vi项示出可在用于插入元件序列的IIs型限制位点内使用逆选择标记物用于Golden Gate克隆（或其它）。应注意，所述方法不限于使用Bsal 作为IIs型限制酶，也不限于使用IIS限制酶，只要由限制得到的侧翼与待插入的单一或模块式元件或int/侧翼序列的侧翼相容即可。
[0062] 图5示出在此文件中所描述的方法和系统在水平1的模块性。通过从水平0选择多个元件并且用在单锅Golden Gate (或其它）克隆反应中，产生待在水平2 (图1或2)用作文库的功能性表达盒的文库，并且可能地可与图6的步骤2组合。
[0063] 图6示出在此文件中所描述的方法和系统在水平2的模块性（针对图1)。功能性表达盒的文库可添加待经由体内组装和重组组装的一个或更多个模块，从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库。任选地，可在水平3回收所述文库。
[0064] 图7示出在此文件中所描述的方法和系统在水平2的模块性（针对图2)。类似于图6,但在水平2步骤a具有中间体外步骤：功能性表达盒的文库可添加待经由体外组装而组装的一个或更多个模块。这个步骤可通过所得（并且可能回收的）多部分DNA序列的体内组装来进行，从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库。任选地，可在水平3回收所述文库。
[0065] 图8示出并且在水平2(A)_(E)的多个变体（但不限于这些）中描述：具有独特至少25 bp连接物序列的相同的骨架（bbn)载体可被应用来体内产生敲除或整合构建体，如以下所述。水平1示出水平〇的不同元件（但不限于其）可如何插入骨架载体（还参见图4)，可组装来产生侧翼为用于按规定顺序在水平2进行体内组装所需要的一个或两个连接物序列的模块式元件。这些独特连接物使得可以有效地再利用这些元件载体并且允许按组合方式直接使用或作为文库使用，以产生例如涵盖多个基因的DNA伸展序列的敲除，或在文库中与int-L和int-R序列（水平2C)产生在宿主细胞中具有减少的质粒、染色体或其它DNA片的宿主细胞的文库。通常地，将应用功能性标记物盒与至少一个int-L和一个 int-R序列（按所述顺序处于靶位点处，但不一定连接）。以下为数种策略（但不限于此）： (A)产生标记物的插入以置换靶位点处的orf ;(B)产生标记物的插入以置换靶位点处的由 int-L和int_R限定的所选择DNA部分；(C)产生标记物的插入以置换靶位点处的由作为文库添加的int-L和int_R序列的组合可能性限定的所选择DNA部分，从而导致小至较大的 DNA部分被置换，这取决于选择用于至少一种染色体、质粒或其它靶DNA的int-L与int-R 序列的最大距离；(D)示出部分（B)可被改变来在靶位点处插入特定元件或其一部分。这可应用来以标准化的模块式方式，通过合理设计或作为文库方法交换蛋白质中的信号序列、启动子、5'UTR或模块式部分。可行的实例为启动子调谐（promoter tuning)，或另一种模块式蛋白像NRPS、PKS、纤维素酶以及其它模块式蛋白等的变体的产生；(E)示出当使用多于一种的标记物和第二组与第一种不相容的连接物序列时，可一次进行多个动作。
[0066] 应注意对于（D)，int-R需要与靶位点正确匹配，从而不扰乱原始阅读框架。
[0067] 当然，图8的方法可与图1或图2组合来使一个或更多个模块式DNA盒插入一个或更多个靶位点，同时如图8所述、作为一个或更多个预定序列或作为文库方法（图5-7) 将标记物插入在第二位置并且去除或插入DNA序列。
[0068] 图9示出2步途径构筑法的一般方案，所述方法为一种快速、有效且灵活的方法，这是由于用于golden gate克隆的标准化的遗传元件与提供用于体内重组的同源性的标准化的连接物相组合。
[0069] 图10示出基于所获得的GFP结果，启动子表达强度的排序。所述方法的功效通过小的标准差示出，这表明了大量的正确转化株。
[0070] 图11示出在针对各个启动子的lacZ和GFP报告子测定中获得的结果之间的相关性是可接受的，报道基因测定证实并且加强了针对各启动子获得的结果。
[0071] 图12阐述终止子对GFP表达的影响。再次，各系列的4个测试菌落的小标准差指示高百分比的正确转化株。以最暗灰色描述的终止子的所发现大标准差是由没有GFP信号的转化株（不正确转化株的几个例外的一个）引起。
[0072] 图13阐述在凝胶上针对衣康酸途径的组装分析的PCR反应的结果。PCR反应产生正确的带大小，从而指示基因组中途径的正确整合与组装。
[0073] 图14示出质粒Te pep. bbn的示意图，所述质粒用于组装EBA328和EBA332表达盒。所述载体包含在ReP印A 0RF上游1.5 kb用于靶向到ReP印A位点中的1500 bp 5'侧翼区、1οχ66位点、由构巢曲霉（A. nidulans)gpdA启动子驱动的ble编码区的非功能5'部分（5, ble)，以及ccdB基因。
[0074] 图15示出质粒pEBA1006的示意图，所述质粒与pEBA328_EBA332组合用于二分基因祀向法中，目标为在Rasamsonia emersonii中通过两个GH61表达盒置换RePepA 0RF和起始ATG密码子上游的约1500个核苷酸。所述载体包含ble编码区的3'部分、构巢曲霉trpC终止子、1οχ71位点、ReP印A 0RF的2500 bp 3'侧翼区以及pUC 19的骨架 (Invitrogen，Breda, The Netherlands)。通过用限制酶Notl消化去除大肠杆菌DNA，之后转化R. emersonii菌株。
[0075] 图16示出质粒pEBA328的示意图，所述质粒用作PCR的模板，以使用吉布森克隆获得质粒pEBA328_EBA332。所述载体包含在ReP印A 0RF上游1.5 kb用于靶向到 RePepA位点中的1500 bp 5'侧翼区，由黄青霉（P. chrysogenum)Paf启动子、嗜热篮状菌 (Talaromyces thermophilus)GH61编码区以及黄青霉penDE终止子组成的EBA328表达盒，1οχ66位点、由构巢曲霉gpdA启动子驱动的ble编码区的非功能性5'部分（5'ble)。 PEBA328为pEBA332的代表，其含有EBA332表达盒而非EBA328表达盒。EBA332表达盒由 R. emersonii启动子2、绵毛嗜热丝孢菌（Thermomyces lanuginosa)GH61编码区以及构巢曲霉amdS终止子（TamdS)组成。
[0076] 图17示出质粒pEBA328 EBA332的示意图，所述质粒与pEBA1006载体组合用于二分基因祀向法中，目标为在Rasamsonia emersonii中通过两个GH61表达盒置换RePepA 0RF和起始ATG密码子上游的约1500个核苷酸。所述载体包含在ReP印A 0RF上游1. 5 kb 用于靶向到RePepA位点中的1500 bp 5'侧翼区，由黄青霉Paf启动子、嗜热篮状菌GH61 编码区以及黄青霉penDE终止子组成的GH61表达盒EBA328,由R. emersonii启动子2、绵毛嗜热丝孢菌GH61编码区以及构巢曲霉amdS终止子（TamdS)组成的GH61表达盒EBA332， 1οχ66位点、由构巢曲霉gpdA启动子驱动的ble编码区的非功能性5'部分（5'ble)。通过用限制酶Notl消化去除大肠杆菌DNA，之后转化R. emersonii菌株。
[0077] 图18示出质粒ρΕΒΑΙΟΟΙ的示意图，所述质粒与pEBA1002载体组合用于二分基因革巴向法中，目标为在Rasamsonia emersonii中使ReKu80 0RF缺失。所述载体包含2500 bp 5'上游侧翼区、1οχ66位点、由构巢曲霉gpdA启动子驱动的ble编码序列的5'部分以及 pUC19的骨架（Invitrogen，Breda, The Netherlands)。通过用限制酶Notl消化去除大肠杆菌DNA，之后转化R. emersonii菌株。
[0078] 图19示出质粒pEBA1002的示意图，所述质粒与ρΕΒΑΙΟΟΙ载体组合用于二分基因革巴向法中，目标为在Rasamsonia emersonii中使ReKu80 0RF缺失。所述载体包含ble编码区的3'部分、构巢曲霉trpC终止子、1οχ71位点、ReKu80 0RF的2500 bp 3'下游侧翼区以及pUC19的骨架（Invitrogen，Breda, The Netherlands)。通过用限制酶Notl消化去除大肠杆菌DNA，之后转化R. emersonii菌株。
[0079] 图20示出用于使R. emersonii的ReKu80基因缺失的策略。用于使ReKu80缺失的载体包含侧翼为loxP位点的重叠非功能性ble选择标记物片段（分开的（split)标记物）以及用于靶向的ReKuSO基因的5'和3'同源区（1)。所述构建体通过三重同源重组 (X)在基因组ReKuSO位点以及重叠同源非功能性ble选择标记物片段处整合（2)并且置换基因组ReKuSO基因拷贝（3)。随后，通过ere重组酶的瞬时表达去除选择标记物，从而在 1οχ66与1οχ71位点之间引起重组，导致ble基因缺失，而剩余双重突变1οχ72位点留在基因组中（4)。使用这种总体策略，从基因组中去除ReKu80 0RF。
[0080] 图21示出用于在真菌中瞬时表达ere重组酶的质粒pEBA513的示意图。pEBA513 为PAMPF21衍生的载体，其含有AMA1区和CAT氯霉素抗性基因。描绘了 ere重组酶基因 (ere)表达盒，其含有黑曲霉（A. niger)glaA启动子（Pgla)、cre重组酶编码区以及niaD终止子。另外，示出了由构巢曲霉gpdA启动子（PgpdA)、hygB编码区以及黄青霉penDE终止子（TpenDE)组成的潮霉素抗性盒。
[0081] 图22示出在2%玉米秸杆活性测定中测试的上清液的剂量应答曲线。将不同剂量的上清液的摇瓶发酵物与2%玉米秸杆一起孵育，并且在65°C下孵育72小时。使用NMR 量化释放的糖。X轴：（稀释）上清液的蛋白浓度，将200 μ 1上清液添加至800 μ 1底物，得到1 ml的最终测定体积。Υ轴：相对葡萄糖释放（AGlc，任意单位）：针对酶溶液中存在的残余糖（由空白测量）以及酸预处理的玉米秸杆中存在的残余糖，校准样品中测量的葡萄糖。空心圆：pEBA328_EBA332转化株；空心方块：2个空参考菌株的曲线；虚线：pEBA328_ EBA332 曲线拟合的95%置信区间。
[0082] 图23示出选择标记物盒的使用。在选项1中，可共用一个或更多个启动子-开放阅读框架-终止子（Ρ0Τ)盒，其编码可选择标记物，以用于在宿主1中进行组装并且在宿主 2中应用，例如P〇T 2。在选项2中，在内部侧翼之外的一个或更多个Ρ0Τ盒编码可选择标记物以用于在宿主1中组装，并且另外的在内部侧翼中的一个或更多个Ρ0Τ用于在宿主2中应用，例如卩〇1' 2用于宿主1，并且卩01'3用于宿主2。
[0083] 序列表说明
[0084] SEQ ID N0 :1至30阐述启动子元件的序列如下：SEQ ID N0 :1 :启动子元件 Sc. EN01. Pro ;Seq ID N0 :2 :启动子元件Sc PDCI. pro ;Seq ID N0 :3 :启动子元件ScEN02· IDN0 :6 :启动子元件 Sc PGK1. pro ;Seq ID NO :7 :启动子元件 Sc GPM1. pro ;Seq ID NO :8 : 启动子元件 Sc PMA1_L pro ;Seq ID NO :9 :启动子元件 Sc 0YE2. pro ;Seq ID NO :10 :启动子元件 Sc TALL pro ;Seq ID NO :11:启动子元件 Sc TDHI. pro ;Seq ID NO :12:启动子元件ScTDH3·pro;SeqIDN0:13:启动子元件ScTEFI·pro ;SeqIDN0:14:启动子元件Sc 丁卩11邛1'〇;569 10勵：15:启动子元件5。4(：1'1邛1'〇;569 10勵：16:启动子元件48了6打· pro ;Seq ID NO :17 :启动子元件 Sc PRE3. pro ;Seq ID NO :18 :启动子元件 Sc VPS68. pro ; Seq ID NO :19 :启动子元件KLLA0A09185g(乳酸克鲁维酵母（K. lactis)启动子1) ;Seq ID 冊：20:启动子元件1(^(^110118(乳酸克鲁维酵母启动子2);5叫10勵：21:启动子元件 KLLA0B08998g(乳酸克鲁维酵母启动子3) ;Seq ID NO :22 :启动子元件KLLA0B14839g(乳酸克鲁维酵母启动子4);5叫10^):23:启动子元件1(^(? 148838(乳酸克鲁维酵母启动子5);5叫10勵：24:启动子元件1(^0)55668(乳酸克鲁维酵母启动子6) ;5叫10 N0 :25 :启动子元件KLLA0D00979g(乳酸克鲁维酵母启动子7) ;Seq ID N0 :26 :启动子元件 KLLA0D07634g(乳酸克鲁维酵母启动子8) ;Seq ID N0:27:启动子元件KLLA0E01057g(乳酸克鲁维酵母启动子9) ;Seq ID勵：28:启动子元件1(^(^1826(^(乳酸克鲁维酵母启动子 10);5叫10勵：29:启动子元件虬1^(^200318(乳酸克鲁维酵母启动子11) ;以及5叫10 N0 :30 :启动子元件KLLA0F20988g(乳酸克鲁维酵母启动子12)。
[0085] SEQ ID N0 :31 至 35 阐述 0RF 的序列如下：Seq ID NO :31 :0RF 元件 vGFP ;Seq ID NO :32 :0RF 元件 RFP ;Seq ID NO :33 :0RF 元件 LacZ ;Seq ID NO :34 :0RF 元件 GFPmut3 ;以及 Seq ID NO :35 :0RF 元件 GFP-pest。
[0086] SEQ ID NO :36至49阐述终止子序列如下：Seq ID NO :36 :元件ADH1终止子；Seq ID NO :37 :元件 ADH2 终止子；Seq ID NO :38 :元件 EN01 终止子；Seq ID NO :39 :元件 GPM1 终止子；Seq ID NO :40 :元件 PDCI 终止子；Seq ID NO :41 :元件 PGI1 终止子；Seq ID NO : 42 :元件PGK1终止子；Seq ID NO :43 :元件PMA1终止子；Seq ID NO :44 :元件TALI终止子； Seq ID NO :45 :元件 TDH1 终止子；Seq ID NO :46 :元件 TDH3 终止子；Seq ID NO :47 :元件 TEF1终止子；Seq ID NO :48 :元件TEF2终止子；以及Seq ID NO :49 :元件TPI1终止子。
[0087] SEQ ID NO :50阐述用于SEQ ID NO :1至49的所有元件的大肠杆菌载体的序列。
[0088] SEQ ID N0 :51至63阐述连接物的序列（参见实施例）。
[0089] Seq ID N0 :64至SEQ ID N0 :85阐述骨架进入载体的序列（参见实施例）。
[0090] Seq ID N0 :86阐述用于SEQ ID N0 :64至85的所有骨架进入载体的大肠杆菌载体的序列。
[0091] SEQ ID N0 :87 至 SEQ ID NO :112 阐述 PCR 引物序列如下：Seq ID NO :87 :con5 forw ；Seq ID NO ：88 ：cona rev ；Seq ID NO：89 ：cona forw ；Seq ID NO ：90 ：conb rev ；Seq ID NO ：91 ：conb forw ；Seq ID NO ：92 ：conc rev ；Seq ID NO ：93 ：conc forw ；Seq ID NO ： 94 ：conD rev ；Seq ID NO：95 ：conD forw ；Seq ID NO：96 ：conE rev ；Seq ID NO：97 ：conE forw ；Seq ID NO ：98 ：conF rev ；Seq ID NO ：99 ：conF forw ；Seq ID NO ：100 ：conG rev ；Seq ID NO ：101 ：conG forw ；Seq ID NO ：102 ：conH rev ；Seq ID NO ：103 ：conH forw ：Seq ID NO： 104 ：conl rev ；Seq ID N0：105：conl forw ；Seq ID N0：106：conJ rev ；Seq ID NO： 107： conj forw ；Seq ID N0：108：conK rev ；Seq ID NO ：109 ：conK fw ；Seq ID N0：110：con3 rev;Seq IDN0:lll:KanMX添加连接物上的 5950 正向引物；以及 Seq ID N0:112:KanMX 添加连接物b上的5951反向引物。
[0092] Seq ID NO : 113阐述装备有连接物a和b的PCR片段KanMX标记物的序列。
[0093] SEQ ID :114阐述左侧翼INT1上的正向引物的序列。
[0094] SEQ ID N0 :115阐述左侧翼INT1添加连接物5上的反向引物序列。
[0095] SEQ ID N0 :116阐述具有用于在INT1进行整合的连接物5的左侧翼的序列。
[0096] SEQ ID N0 :117阐述右侧翼INT1添加连接物3上的正向引物的序列。
[0097] SEQ ID NO :118阐述左侧翼INT1上的反向引物的序列。
[0098] SEQ ID N0 :119阐述具有用于在INT1进行整合的连接物3的右侧翼的序列。
[0099] SEQ ID N0 :120、121、122、123、124以及125阐述针对在酿酒酵母中 (S. cerevisiae)产生衣康酸的代谢途径的构建而特定合成的开放阅读框架（参见表5)。
[0100] SEQ ID N0:126阐述R. emersonii RePepA(包括侧翼的基因组序列）的序列。
[0101] SEQ ID N0 :127 阐述 R. emersonii RePepA(cDNA)的序列。
[0102] SEQ ID NO :128 阐述 R. emersonii RePepA(蛋白质）的序列。
[0103] SEQ ID NO :129阐述构巢曲霉gpdA启动子和ble编码区的5'部分的序列。
[0104] SEQ ID NO :130阐述ble编码区的3'部分和构巢曲霉TrpC终止子的序列。
[0105] SEQ ID NO :131阐述黄青霉Paf启动子的序列。
[0106] SEQ ID NO :132阐述嗜热篮状菌GH61的序列。
[0107] SEQ ID NO :133阐述黄青霉penDE终止子的序列。
[0108] SEQ ID N0 :134 阐述 R. emersonii 启动子 2 的序列。
[0109] SEQ ID NO :135阐述绵毛嗜热丝孢菌GH61的序列。
[0110] SEQ ID NO :136阐述构巢曲霉AmdS终止子的序列。
[0111] SEQ ID NO :137阐述正向吉布森引物的序列。
[0112] 用于接合pEBA1013载体部分与EBA328表达盒的5' ReP印A区-Ppaf。
[0113] SEQ ID NO :138阐述反向吉布森引物TpenDE的序列。
[0114] SEQ ID N0:139阐述用于接合EBA328 与EBA332 表达盒的正向吉布森引物 TpenDE-Ppra 的序列。
[0115] SEQ ID NO :140阐述反向吉布森引物Tamds的序列。
[0116] SEQ ID NO :141阐述用于接合EBA332表达盒与pEBA1013载体部分的正向吉布森引物 Tamds-loxP-gpd-ble 的序列。
[0117] SEQ ID NO :142阐述反向吉布森引物Y ReP印A的序列。
[0118] SEQ ID NO :143阐述ReKu80(基因组序列，具有侧翼的编码区）的序列。
[0119] SEQ ID NO :144 阐述 ReKu80(cDNA)的序列。
[0120] SEQ ID NO :145 阐述 ReKu80(蛋白质）的序列。
[0121] 发明详沭
[0122] 贯穿本说明书和随附权利要求书，词语"包含"、"包括"和"具有"以及变型应解释为包括性的。即，这些词语旨在传达在上下文允许的情况下，可包含未具体列举的其它元件或整体。
[0123] 在本文中未使用数量词时用来指语法对象有一个或一个以上（即一个或至少一个）。举例来说，"元件"可意指一个元件或一个以上的元件。
[0124] 本发明的系统包含具有高多样性和灵活性的限定组的部件，借此给定系统可容易地应用于许多不同的应用。值得注意的是，给定系统可用于包含不同数量的待组装成目的核酸盒的表达元件的应用。本发明的极大优势在于许多不同的表达元件可与数量比待组合的表达元件的数量小的骨架载体组合。因此，所述系统可根据许多不同的表达元件的组合和表达元件数量进行缩放，而无需用于使连接物适合于大量表达元件的额外的克隆工作。
[0125] 因此根据本发明，提供一种用于制备两种或更多种标准化的模块式表达盒的方法，所述方法包括：
[0126] a.提供两组或更多组元件序列，
[0127] 每组元件序列一起构成至少一种功能性表达盒，
[0128] 各元件序列两侧侧翼为IIs型限制核酸内切酶切割位点，之后是其识别位点，
[0129] 所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒；
[0130] b.提供至少两种骨架进入载体，
[0131] 各骨架进入载体按以下这种顺序包含：（i)限制酶与其识别位点，和通常地至少约9 bp长的第一连接物序列（LF) ;(ii)包含可选择标记基因的载体骨架；以及（iii)同样通常地至少约9 bp长的第二连接物序列（RF)，和限制酶识别位点与其切割序列；以及（iv) 任选地，在（i)和（iii)的识别位点之间的插入物，
[0132] 任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装；
[0133] c.使用基于经由所述切割位点使用限制酶消化和连接的方法，在所述至少两种骨架进入载体中组装所述两组或更多组元件序列作为功能性表达盒，
[0134] 从而制备两种或更多种标准化的表达盒。
[0135] 所述标准化的表达盒可易于在体内重组。因此，本发明提供用于在宿主细胞中在靶位点处体内重组两种或更多种标准化的模块式表达盒的方法，所述方法包括：
[0136] a.根据本文以上所述的方法制备两种或更多种标准化的模块式表达盒，其中：
[0137] i. RF和LF连接物序列包含通常地至少25个碱基对长的同源重组序列；以及
[0138] ii.任何骨架进入载体上的RF和LF序列被选择成使得其可通过体内重组分别与 LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及
[0139] b.从包含LF和RF序列的骨架进入载体回收表达盒；以及
[0140] c.在宿主细胞中在靶位点处将所回收的表达盒彼此体内重组。
[0141] 还提供用于在宿主细胞中在靶位点处将两种或更多种标准化的表达盒体内重组的方法，所述方法包括：
[0142] a.根据以上所述的方法制备两种或更多种标准化的模块式表达盒，其中：
[0143] i. RF和LF连接物序列包含至少9个碱基对的同源序列；以及
[0144] ii.任何骨架进入载体上的RF和LF序列被选择成使得其可使用这些序列通过体外方法分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及
[0145] b.从通过LF和RF序列体外连接的骨架进入载体组装并且回收表达盒；以及
[0146] c.在宿主细胞中在靶位点处将所回收和组装的表达盒体内重组。
[0147] 在本发明中，组装目的核酸构建体并且通常地整合在靶位点处。通常地，可将一系列表达盒整合在祀位点处。
[0148] 根据本发明的方法涉及核酸分子彼此以及与靶位点的重组。重组是指其中核酸分子断裂并且然后接合至不同核酸分子的过程。本发明的重组过程通常地涉及可来自相同或不同生物体的不同核酸分子的人工和有意重组，从而产生重组核酸。
[0149] 本发明的方法通常地依赖于同源重组反应。"同源重组"是指具有含有相似核苷酸序列（即，同源序列）的对应位点的核苷酸序列之间的反应，通过其分子可相互作用（重组），从而形成新的重组核酸序列。相似核苷酸序列的位点在本文中各自称为"同源序列"。通常，同源重组的频率随着同源序列的长度增加而增加。因此，尽管同源重组可发生在不太一致的两个核酸序列之间，但重组频率（或效率）随着两个序列之间的相异性增加而下降。
[0150] 可使用本发明的方法将一系列组装的表达盒整合在靶位点处（通常地通过同源重组）。
[0151] 靶位点为期望整合组装的核酸的任何位置。位点可为染色体位点，即在宿主细胞的基因组内，或为染色体外位点，例如质粒或人工染色体。用于靶向所选择的靶位点的序列将通常地为靶位点侧翼的序列。核酸序列在靶位点处的整合可导致所述序列在没有序列丢失的情况下整合在靶位点处。或者，整合可伴随有序列从靶位点的丢失。因此，核酸序列在靶位点处的整合可导致编码序列的部分或完全缺失，例如这样使得一个或更多个基因被部分或完全敲除。
[0152] 两种或更多种表达盒可根据本发明在2步法中按模块式方式进行组装（参见图1 和图1. 2)。
[0153] 在水平1，将元件序列的组与含有允许组装功能盒的左和右连接物DNA序列的骨架DNA序列（LF和RF con序列）组装在一起，其通常地含有包括启动子、orf以及终止子序列的至少2个元件。
[0154] 在水平2,发生至少一种表达盒、但通常地两种或更多种表达盒与用于靶向整合的 5' DNA侧翼以及用于靶向整合的3' DNA侧翼的体内组装，并且在靶位点处发生整合。
[0155] 另外，在水平3,可进行步骤来从宿主细胞获得组装的表达盒，以用于在宿主细胞外进行进一步处理和/或用来修饰另一宿主细胞，或作为DNA产物。这可通过以下方式来实现：提供用于与另外的序列进行整合的，被设计成允许在第二靶位点处、通常地在第二宿主细胞中进行整合的序列。
[0156] 在图1中，水平2描述了模块式表达盒从功能性表达盒以及5'和'3盒通过体内 DNA重组在靶位点处的组装。图2描述了替代方案，其中水平2分成a和b，即首先进行体外组装步骤以获得模块式表达盒，其在水平2b在宿主中在靶位点处进一步体内重组成完整的模块式DNA表达盒。
[0157] 在水平2a (图2)，可应用但不限于称为SLIC、吉布森以及CPEC的方法。这些方法是提供标准化的、无痕（scarless)的、（大部分）不依赖于序列的、多部分DNA组装的相关方法。由于起始材料和最终产物对于这三种方法是相同的，因此均可使用至少9 bp并且对于具体方法的效率来说可需要更长的相同同源连接物序列来加以应用（http ://j5. jbei. org/j5manual/pages/22. html)〇
[0158] 在水平1，通常地通过单一 IIs型限制核酸内切酶来催化限制。然而，也可以应用多个IIs型限制核酸内切酶，或针对元件序列载体的IIs型限制核酸内切酶与产生伸出序列（overhang)的II型限制酶的组合，所述伸出序列与对用于组装功能性表达盒的元件或具有整合侧翼（int)的表达盒的左和右元件设计的那些相容。连接是通过连接酶来催化。
[0159] 本发明的方法允许通过经由在片段两端形成的单链伸出序列、使用IIs型限制核酸内切酶来组装核酸片段构建体由元件序列组产生目的表达盒。在本发明中，可使用IIs 型限制酶。IIs型限制核酸内切酶识别位点为限制核酸内切酶识别双链DNA并且在切割位点切割双链DNA的识别位点，所述切割位点在双链DNA的识别位点外。IIs型限制核酸内切酶进行切割，以使得产生3至6个核苷酸的伸出序列，这取决于具体IIs型限制核酸内切酶。通常地，在本发明的方法中，可使用产生4个核苷酸的伸出序列的酶。然而，还可使用产生更长单链伸出序列的IIs型核酸内切酶。在切割时形成伸出序列的核苷酸范围在本文中称为切割位点。由于切割位点的核苷酸不是识别位点的一部分，因此其可根据期望在不破坏IIs型限制核酸内切酶的切割活性的情况下进行选择。表5给出适于本发明的方法的 IIs型限制核酸内切酶的实例。
[0160] 对于实施本发明，可使用提供足以在其切割位点进行有效连接的"粘性"末端的任何IIs型限制酶。对所述酶的选择被提供在REBASE网页（rebase. neb. com/cgi-bin/ asymmlist)和Szybalsky等人.（1991，Gene，100:13_26)的综述中。具有不对称识别位点的切割位点在识别位点之外并且在切割时提供至少三个、优选4个或更多个核苷酸残基伸出序列（例如BLi736I ;BpuAI、VpaK321、SfaNI等）的II型限制酶（例如，此网页中示出的那些）可用在本发明中。
[0161] 推荐识别位点含有至少4个、更优选至少6个或更多个碱基对，以便将在目的序列部分中发现所述位点的机会最小化。还可使用具有5 bp识别位点（例如SfaNI)的IIs型限制核酸酶。在消化片段的端点产生4 nt单链伸出序列的IIs型限制核酸内切酶在理论上可产生具有256种可能的序列的末端。具有甚至更长的识别位点、例如包含十个或更多个碱基对的IIs型限制酶已被工程化。天然IIs型酶中的最大识别位点是针对酶Sapl的，其具有7bp识别位点。一个优选解决方案是使用人工IIs型酶，其被改造以具有长的识别位点（Lippow 等人，2009，Nucleic acides Res.，37 :3061-3073)。例如，预期具有 18 bp 识别位点的IIs型酶仅至多切割每个真核基因组数次，并且将允许制作不必改变天然序列的任何核苷酸的最多进入模块。
[0162] 水平2选项b (图1):可包含具有左和右DNA侧翼的另外的骨架用于在水平3回收后的之后的在第二宿主中的整合。
[0163] 可进行本发明的方法，其中在两种整合序列存在下进行重组步骤，其中一个与第一表达盒和靶位点的侧翼序列重组，并且其中第二个与第二表达盒和靶位点的另一侧的侧翼序列重组。
[0164] 或者，整合序列可由两种骨架进入载体来提供。因此，可进行本发明的方法，以使得在重组步骤中，第一表达盒包含与靶位点的侧翼序列重组的整合序列，并且第二表达盒包含与靶位点的另一侧的侧翼序列重组的整合序列。
[0165] 整合序列可包含用于与第二靶位点、任选地与第一靶位点种类不同的宿主细胞中的位点进行重组的另外的序列。
[0166] 整合序列将通常地允许在靶位点处经由同源重组来进行重组。也就是说，整合序列将通常地与靶位点处的序列具有足够的同源性，以使得能够经由同源重组在靶位点处整合两种或更多种表达盒。
[0167] 介导组装的表达盒与靶位点之间的同源重组的序列的长度可为至少约20 bp、至少约30 bp、至少约50 bp、至少约0.1 kb、至少约0.2 kb、至少约0.5 kb、至少约1 kb或至少约2 kb。
[0168] 或者，整合序列可为由位点特异性重组酶识别的序列。也就是说，整合序列可允许经由位点特异性重组在适合重组酶存在下进行整合。
[0169] 在本发明的方法中，可提供整合序列，其提供在一个宿主细胞种类中与第一靶位点重组以及然后在第二宿主细胞种类中与靶位点的重组。可在所述整合序列之间常规地提供选择标记物（用于在第一宿主细胞种类中选择）。显然，一个必要是将所述标记物放置在位于表达盒一侧的两个整合位点之间。例如，整合位点可提供在表达盒的5'和3'端，其对于第一宿主细胞种类中的靶位点是特异的。选择标记物然后可被提供成邻近于一个整合位点、位于整合位点与表达盒一端之间。选择标记物将通常地适于在第一宿主细胞种类中进行选择。然后，可提供用于第二宿主细胞种类的另外的整合位点。这些整合位点中的一个将位于选择标记物与表达盒的一端之间。然后另一个将定位在表达盒的另一端与整合位点 (对于第一宿主细胞种类特异）之间。
[0170] 这种方法图解在图23中，其示出选择标记物盒的使用。在选项1中，可共用一个或更多个启动子-开放阅读框架-终止子（Ρ0Τ)盒，其编码可选择标记物以用于在宿主1 中组装和在宿主2中应用，例如Ρ0Τ 2。在选项2中，在内部侧翼之外的一个或更多个Ρ0Τ盒编码可选择标记物，以用于在宿主1中组装，并且另外的在内部侧翼中的一个或更多个Ρ0Τ 用于在宿主2中应用，例如？0凡用于宿主1，并且？01~3用于宿主2。
[0171] 在本发明的方法中，可在靶位点处按预定顺序顺次（in series)组装并且重组一系列表达盒，例如至少约 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20或更多个表达盒。
[0172] 可进行所述方法以使得至少一个表达盒能够表达标记物。也就是说，至少一个表达载体可编码可充当标记物的多肽。
[0173] 在本发明的方法中，可使用不根据本发明的方法产生的一个或更多个表达盒。
[0174] 在本发明的方法中，提供至少两组元件序列。每组元件序列将通常地能够组装成表达盒。在本发明的背景下，表达盒旨在指示引导细胞机器制作RNA和蛋白质的核酸序列。通常地，表达盒将包含编码序列和控制所述编码序列的表达的序列。通常地，表达盒可至少包含启动子、开放阅读框架以及终止子序列。
[0175] 术语"控制序列"在本文中定义为包括对于mRNA或多肽在体外或在宿主细胞内的产生必要或有利的所有成分。各控制序列对于编码多肽的核酸序列可为天然的或外源的。所述控制序列包括但不限于前导子、Shine-Delgarno序列、最优翻译启始序列（如Kozak, 1991，J. Biol. Chem. 266 :19867-19870所述）、聚腺苷酸化序列、肽原序列、前肽原序列、启动子、信号序列以及转录终止信号。至少，控制序列通常地包含启动子以及转录终止信号 (终止子或终止信号）。还可通常地存在翻译起始和停止信号。控制序列可根据其具体目的而加以优化。
[0176] 术语"启动子"在本文中定义为结合RNA聚合酶并且引导聚合酶至编码生物化合物的核酸序列的正确下游转录起始位点从而启始转录的DNA序列。RNA聚合酶有效地催化与编码区的适合DNA链互补的信使RNA的组装。还应理解，术语"启动子"包括用于在转录成mRNA后翻译的5'非编码区（在启动子与翻译起点之间）、顺式作用转录控制元件如增强子，以及能够与转录因子相互作用的其它核苷酸序列。
[0177] 通常地进行本发明的方法，使得表达盒的元件在骨架进入载体中进行组装，这样使得它们处于可操作连接。术语"可操作连接（operable linkage)"或"可操作连接 (operably linked) "等在本文中定义为以下构型，其中控制序列被适当地放置在相对于 DNA序列的编码序列的位置处，这样使得控制序列引导mRNA或多肽的产生。
[0178] 因此，在本发明的背景下的元件为表达盒的任何组成部分。元件的组为可一起产生表达盒的元件的组。本发明的方法需要提供两组元件序列。这意味着提供足够的元件以使得可产生至少两种不同的表达盒。这暗含必须提供至少两种不同种类的至少一种元件。也就是说，出于本发明的目的，一种启动子与两种0RF以及两种终止信号相组合构成两组元件序列。
[0179] 在本发明的方法中，通常地元件序列组中的至少两组包含启动子元件、开放阅读框架元件以及终止信号元件。
[0180] 在根据本发明的方法中，元件组中的一组或更多组可包含"部分"元件序列，如 UTR、信号肽以及分开的（split)开放阅读框架。
[0181] 按一种形式提供每组元件序列以使得所述组可在骨架进入载体中组装成功能性表达盒。因此通常地，各元件在两侧侧翼为IIs型限制核酸内切酶切割位点，之后是其识别位点，所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒。各元件序列和侧翼序列因此通常地按顺序从一端到另一端包含：IIs 型限制核酸内切酶识别位点；其切割位点；元件序列；IIs型限制核酸内切酶切割位点；其识别位点。
[0182] 因此，在合适载体中制备或提供的所述元件的组，其具有IIs型限制核酸内切酶识别位点和标准化的切割位点（优选4 bp)所述位点被选择成使得例如使用单锅法（如 Golden gate克隆）组装后，形成功能性表达盒。
[0183] 制备或提供骨架进入载体的组。这些载体含有适于使用序列同源性进行组装的左和右连接物序列，以用于在（参见图1和图2的水平1)组装模块式盒。
[0184] 更详细来说，各骨架进入载体通常地按以下这种顺序包含：（i)限制酶切割位点与其识别位点，和第一连接物序列（LF) ;(ii)包含可选择标记基因的载体骨架；以及（iii) 第二连接物序列（RF)，和限制酶识别位点与其切割序列；以及（iv)任选地，在（i)和（iii) 的识别位点之间的插入物，任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列组装。
[0185] 选择元件序列的亚组与骨架（bbn)进入载体。可例如使用Golden Gate克隆将它们进行组装，从而产生包含在骨架进入载体中的功能性表达盒。
[0186] 在根据本发明的方法中，每组中的元件被限定成使得按预定顺序组装表达盒。另夕卜，骨架进入载体中的连接物序列还被选择成使得表达盒可按预定顺序组装。
[0187] 用于在靶位点处进行整合的左和右侧翼（参见图1和图2的水平2)可通过骨架进入载体本身来提供，或可作为另外的序列来添加。可经由PCR反应提供整合序列，其中它们是所用引物的一部分。
[0188] 在水平2,在适合的宿主细胞中发生功能性表达盒与整合侧翼（int)和含有用于体内组装的连接物（con)序列的可能的其它DNA序列的体内组装并且在靶位点处重组。
[0189] 通常地，可通过PCR反应从由水平1得到的载体回收待组装的所有DNA部分，以供在水平2使用，或例如使用经由适合的IIs限制酶以及其设计在con-载体外侧的识别位点切出这些片段的方法，并且切割在其间包含DNA序列的con-载体。
[0190] 图1中的选项a和b均提供用于在靶位点处组装模块式盒的方案。在选项b中，添加另外的左和右整合位点用于第二宿主。选项b之后可以是水平3。
[0191] 在水平3 (参见图1和图2)，可例如经由PCR反应或其它方法从2b回收模块式盒 (或部分）。所回收的DNA用于转化，并且随后在第二宿主在靶位点处整合模块式DNA盒。
[0192] 在本发明的方法中，连接物序列使得能够在来自不同骨架进入载体的表达盒之间进行重组。所述序列的长度可改变，这取决于待进行的组装的类型，即体内或体外，和/或其中发生重组的种类。体内重组的连接物将通常地为约20bp至约500bp长，例如约25bp 长（例如，在酵母的情况下）。例如，待在吉布森反应中体外重组的连接物长度可为约9bp、 10bp、llbp、12bp、13bp、14bp、15bp 或更长。
[0193] 为了促进在所靶向的位点处的所靶向整合并且确保组装，提供用于整合的连接物序列。所述序列长度可为至少约20bp、至少约30bp、至少约50bp、至少约0. 1 kb、至少约 0. 2kb至至少约0. 5 kb、至少约1 kb、至少约2 kb，或至少约5kb。
[0194] 图3示出水平1的组装选项（但不限于这些），其中第iii项为在切割和连接后使用优选地单一 IIs型核酸内切酶和4 bp伸出序列来组装功能性表达盒的优选方法。ii.示出开放阅读框架可分开成信号序列和开放阅读框架的独立部分，或i.以及多个片段形式的开放阅读框架，这例如是由于蛋白质的大小或模块式特征，例如具有独立的结构域的酶像PKS、NRPS、纤维素等，或仅仅由于大小或出于蛋白质工程目的，以便产生orf部分的文库序列。第iv项不出分开成3片以用于orf。第v项不出启动子分开成启动子，其中单独添加基因的5'UTR部分。应注意，这些为实例，并且基本上可设计多部分的分开DNA序列并且使用IIs型系统连接，以产生无痕的DNA序列。在所示情况下，在蛋白质的蛋氨酸起点使用 AATG。此处，启动子序列的最后一个核苷酸始终修饰为A。选择TAAA来桥接终止子，其中在 TAA修饰基因的终止密码子，并且终止子序列的第一位置用A修饰或在5'延伸A。应注意，为有效使用Golden Gate (或其它依赖于IIs型的克隆系统），优选（使得）所有序列不含用于切割的限制酶的识别位点。
[0195] 图4针对骨架（bbn)载体变体的连接物（con)部分示出这些载体。第v项示出通常地应用来在水平1 (图1和图2)用指定的（但不限于）给定4 bp连接物产生功能性表达盒的变体。第iv项和第ii项提供bbn载体变体，其中连接物中的一个被分别用于在革巴位点处进行整合的左和右整合侧翼置换或与其组合。第ii项和第i项为变体，其中仅左或右连接物为骨架的一部分。这些通常地为仅可用在模块式盒的末端的，例如以与整合侧翼一起使用，并且在载体中储存这些。第vi项示出可在用于插入元件序列的IIs型限制位点内使用逆选择标记物用于Golden Gate克隆（或其它）。应注意，所述方法不限于使用Bsal 作为IIs型限制酶，也不限于使用IIS限制酶，只要由限制得到的侧翼与待插入的单一或模块式元件或int/侧翼序列的侧翼相容即可。
[0196] 在本发明的方法中，可组装多个表达盒，每个盒包含生物途径成员。如本文所用，术语"途径"应广泛解释，并且可指一系列同时、连续或单独的化学反应，其通过经由一个或更多个中间物将底物或开始元件转化成终末化合物或期望产物的活性来实现。在某些实施方式中，活性有时是将底物转化为中间物或产物（例如，通过酶催化转化）并且有时是结合分子或配体。如本文所用，术语"一致途径"是指来自相关或不相关生物体的、具有相同数量和类型的活性并且产生相同的终末产物的途径。如本文所用，术语"相似途径"是指来自相关或不相关生物体的、具有以下一项或多项的途径：不同数量的活性、不同类型的活性、利用相同起始或中间分子，和/或产生相同终末产物。
[0197] 根据前述权利要求中任一项所述的方法，其中在至少一组元件中的至少一种元件的变体被提供成使得产生至少一种标准化的模块式表达盒的变体。
[0198] 以此方式，可例如通过利用天然存在的遗传多样性和/或改造的遗传多样性来实现途径改善和优化。可通过测试来自不同生物体的多核苷酸亚组来利用天然存在的遗传多样性。可通过测试例如已经密码子优化或突变的多核苷酸亚组来利用改造的遗传多样性。对于密码子优化的多样性，氨基酸密码子三联体可替换为其它密码子和/或可添加、去除或替换某些核苷酸序列。例如天然密码子可替换为更或更不优选的密码子。在某些实施方式中，可通过将相关或相似的活性替换为来自相似但不一致的途径的一个或多个步骤来优化途径。亚组中的多核苷酸还可遗传改变，以使得当编码时，实现不同于天然对应物的活性的活性，所述天然对应物用作起始材料用于遗传改变。本领域技术人员改变的核酸和/或氨基酸序列可称为"改造的"遗传多样性。
[0199] 任何给定元件的所有变体可全部彼此共有至少约50%序列一致性。
[0200] 代谢途径可视为一系列反应步骤，这些步骤将开始底物或元件转化成最终产物。各步骤可通过一种或更多种活性来催化。在其中底物A转化为终末产物D的途径中，中间物B和C产生并且通过所述途径中的特定活性转化。途径的各特定活性可视为一个种类的活性亚组，并且编码所述活性的多肽可视为一个种类的对应多肽亚组。
[0201] 任何肽、多肽或蛋白质或通过一个或更多个肽、多肽或蛋白质催化的活性可通过多核苷酸亚组来编码。代表性蛋白质包括酶（例如代谢途径的部分或全部）、抗体、血清蛋白（例如白蛋白）、膜结合蛋白、激素（例如生长激素、红细胞生成素、胰岛素等）、细胞因子等，并且包括天然存在的与外源表达的多肽。代表性活性（例如，功能上相关联以在代谢途径中提供活性或活性组的酶或酶的组合）包括与期望代谢途径相关联的任何活性。如本文所用，术语"酶"可指充当催化剂以诱导其它化合物的化学变化、进而由一种或更多种底物产生一种或更多种产物的蛋白质。
[0202] 应理解，在本文所呈现的实施方式中描述的方法和组合物可用于（i)优化产生期望终末产物的任何代谢途径；和/或（ii)优化代谢途径的活性亚组内的亚结构域。如本文所用，术语"蛋白质"指具有由肽键连接的氨基酸序列的分子。这个术语包括融合蛋白、寡肽、肽、环状肽、多肽以及多肽衍生物，无论是天然的还是重组的，并且还包括其片段、衍生物、同源物以及变体。蛋白质或多肽有时是胞内起源（例如体内位于宿主细胞的核内、细胞质内或间质间隙内）并且有时为体内细胞膜蛋白质。在一些实施方式中（以上所述，并且以下在改造与改变方法中进一步详细描述），遗传修饰可导致靶标活性的改变（例如，增大、基本增大、下降或基本下降）。
[0203] 在本发明的方法中，所用表达盒可构成生物学途径，该途径使得能够在宿主细胞中产生目的化合物。目的化合物为初级代谢物、次级代谢物、多肽或多肽的混合物。
[0204] 因此，本发明的方法可在水平1以模块式形式使用（参见图5)。通过从水平0选择多个元件并且用在单锅Golden Gate(或其它）克隆反应中使用，产生待在水平2(图1 或2)用作文库的功能性表达盒的文库，并且可与图6的步骤2组合。
[0205] 所述方法可在水平2以模块式形式使用（例如，在如图1阐述的方法中）。因此，功能性表达盒的文库可被添加待经由体内组装和重组组装的一个或更多个模块，从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库（参见图6)。任选地，可在水平3 回收所述文库。
[0206] 所述模块式方法水平2可在水平2以中间体外步骤来进行（例如在如图2所阐述的方法中）。因此，功能性表达盒的文库可添加待经由体外组装组装的一个或更多个模块 (参见图7)。这个步骤可通过所得（并且可能回收的）多部分DNA序列的体内组装来进行，从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库。任选地，可在水平3回收所述文库。
[0207] 在水平2 (参见图8(A)-(E))的使用具有独特至少25 bp连接物序列的相同骨架 (bbn)载体的多个变体可应用来体内产生敲除或整合构建体。水平1示出水平0的不同元件（但不限于此）可如何插入骨架载体（还参见图4)，可组装来产生侧翼为用于按规定顺序在水平2进行体内组装所要求的一个或两个连接物序列的模块式元件。这些独特连接物使得有可有效地再利用这些元件载体并且允许按组合方式直接或作为文库进行利用，以产生例如涵盖多个基因的DNA伸展序列的敲除，或在具有int-L和int-R序列的文库中使用 (水平2C)，以产生在宿主细胞中具有减少的质粒、染色体或其它DNA片的宿主细胞的文库。通常地，将应用功能性标记物盒与至少一个int-L和一个int-R序列（按所述顺序处于靶位点处，但不一定连接）。
[0208] 以下为数种策略（但不限于此）：(A)产生标记物的插入以置换靶位点处的orf ; (B)产生标记物的插入以置换靶位点处的由int-L和int-R限定的所选择DNA部分；（C)产生标记物的插入以置换靶位点处的由作为文库添加的int-L和int-R序列的组合可能性限定的所选择DNA部分，从而导致小至较大的DNA部分被置换，这取决于选择用于至少一种染色体、质粒或其它靶标DNA的int-L与int-R序列最大距离；(D)示出部分（B)可被改变来在靶位点处插入特定元件或其部分。这可应用来以标准化的模块式方式，通过合理设计或作为文库方法交换蛋白质中的信号序列、启动子、5'UTR或模块式部分。可能的实例为启动子调谐，或另一种模块式蛋白像NRPS、PKS、纤维素酶以及其它模块式蛋白等的变体的产生； (E)示出当使用多于一种的标记物和第二组与第一组不相容的连接物序列时，可一次进行多个动作。
[0209] 应注意对于（D)，int-R需要与靶位点正确匹配，从而不扰乱原始阅读框架。
[0210] 当然，图8所示的方法可与图1或图2所示的方法组合来使一个或更多个模块式 DNA盒插入到一个或更多个靶位点，同时如图8所述、作为一个或更多个预定序列或作为文库方法（图5-7)，将标记物插入在第二位置并去除或插入DNA序列。
[0211] 因此，本发明提供一般2步途径构筑法，其为快速、有效且灵活的方法，这是由于用于golden gate克隆的标准化的遗传元件与提供用于体内重组的同源性的标准化的连接物相组合。
[0212] 本发明因此提供用于在靶位点处整合核酸序列的方法。
[0213] 所述用于在靶位点处整合DNA序列的方法包括：
[0214] a.提供：（i) 一组至少约200个碱基对长的至少两个左（int-L)和两个右（int-R) 整合序列，用于同源重组至宿主细胞中的至少一个靶位点，其中：
[0215] 所述左（int-L)序列侧翼为一个至少约25个碱基对的连接物序列；
[0216] 所述右（int-R)序列侧翼为一个至少约25个碱基对的连接物序列；以及
[0217] (ii)至少一个表达盒，其在两侧侧翼为至少约25个碱基对的连接物序列；以及
[0218] b.通过在int-L和int-R序列的同源革巴位点处重组来体内组装来自步骤（a)的至少三个序列的组，以使得至少一个左和至少一个右整合序列按照这种顺序处于所述宿主细胞的祀位点处，
[0219] 其中体内组装后，至少一个表达盒存在于靶位点处，任选地所述表达盒能够表达功能性标记物。
[0220] 在所述方法中，至少一个表达盒可经由两种或更多种核酸序列在步骤（b)中组装，从而产生例如含有标记物多肽编码0RF的至少一个功能性表达盒。
[0221] 所述方法可包括：
[0222] a.根据权利要求1所述的方法制备两种或更多种标准化的模块式表达盒，其中
[0223] i.所述int-L和int-R序列为启动子、orf或终止子序列的一部分；
[0224] ii.所述RF和LF连接物序列包含至少25个碱基对的同源重组序列；以及
[0225] iii.任何骨架进入载体上的RF和LF序列被选择成使得其可分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列通过体内重组进行组装；以及
[0226] b.从包含LF和RF序列的所述骨架进入载体回收表达盒；以及
[0227] c.在宿主细胞中在所述靶位点处将所回收的表达盒彼此体内重组。
[0228] 用于在靶位点处整合DNA序列的方法可包括：选择两个或更多个int-L和两个或更多个int-R序列，用于在一个体内组装和重组反应中使用，从而产生多个宿主细胞，所述细胞具有通过所选择的int-L和int-R序列祀向至少2个允许的组合的DNA组合，其中：
[0229] i.至少两个int-L序列在所述靶标DNA序列处在至少一个int-R序列的左侧；或
[0230] ii.至少两个int-R序列在所述靶标DNA序列处在至少一个int-L序列的右侧。
[0231] 在这些方法中，第二功能标记物盒可整合在第二靶位点处。因此所述方法可用于产生双重或三重突变体，或含有4、5、6、7、8、9、10或更多个突变的突变体。
[0232] 所述方法可产生一起处于所述靶位点处的功能基因或功能基因组的功能性敲除或下调。也就是说，本发明可用于在靶位点处进行基因的缺失或敲除或敲低。
[0233] 在本发明的所述方法中，至少一个int-R序列可与开放阅读框架的至少开始200 个碱基对同源，并且在左侧功能性联接至待插入在开放阅读框架之前的DNA序列，从而使得开放阅读框架具有至少50个碱基对的修饰的5' UTR序列。这使得能够插入新的启动子和/或置换信号序列。
[0234] 最优选为以下IIs型限制核酸内切酶：Bsal、Bbsl、BsmBI、Sapl、BspMI、Aarl、 Esp31、Bpil以及Hgal。许多列举的限制核酸内切酶可从New England Biolabs获得。这些酶的来源还可见以上所述的REBASE网页。
[0235] 待用于本发明的连接酶的实例包括T4 DNA连接酶、大肠杆菌DNA连接酶、Taq DNA 连接酶，全部可从New England Biolabs商购获得。
[0236] 适用于本发明的宿主细胞可包括以下特点中的一个或更多个：需氧菌、厌氧菌、丝状、非丝状、单倍体、二倍体、营养缺陷型和/或非营养缺陷型。
[0237] 适用于本发明的宿主细胞可为原核微生物（例如细菌）或非原核微生物。适合的宿主细胞可为真核微生物（例如酵母、真菌、变形虫以及藻类）。适合的宿主细胞可来自非微生物来源，例如哺乳动物或昆虫细胞。
[0238] "真菌"在本文中定义为真核微生物并且包括所有真菌亚门的物种（Alexopoulos， C.J.，1962，见 introductory Mycology，John Wiley&Sons，Inc. , New York)。术语真菌因此包括丝状真菌和酵母。"丝状真菌"在本文中定义为包括所有丝状形式的真菌亚门和卵菌门的真核微生物（如上文的Hawksworth等人，1995所定义）。丝状真菌的特征在于菌丝体壁由壳聚糖、纤维素、葡聚糖、甲壳质、甘露聚糖以及其它复杂的多糖构成。营养生长是通过菌丝伸长，并且碳分解代谢是强制好氧的。丝状真菌菌株包括但不限于以下菌株：枝顶孢属（Acremonium)、曲霉属（Aspergi 1 lus)、短梗霉属 (Aureobasidium)、隐球菌属（Cryptococcus)、Filibasidium、鍊抱属（Fusarium)、腐质霉属（Humicola)、稻痕菌属（Magnaporthe)、毛霉属（Mucor)、毁丝霉属（Myceliophthora)、新美鞭菌属（Neocallimastix)、脉抱菌属（Neurospora)、拟青霉属（Paecilomyces)、青霉属（Penicillium)、梨囊鞭菌属（Piromyces)、裂裙菌属（Schizophyllum)、篮状菌属（Talaromyces)、嗜热子囊菌属（Thermoascus)、草根霉属（Thielavia)、弯颈霉属 (Tolypocladium)以及木霉属（Trichoderma)。
[0239] "酵母"在本文中定义为真核微生物，并且包括主要以单细胞形式生长的真菌亚门的所有物种。酵母可通过单细胞菌体的出芽生长或可通过生物体的裂体生长。
[0240] 根据本发明的宿主细胞优选为真菌宿主细胞，其中真菌在本文中定义如上。优选的真菌宿主细胞为如下所述用于工业发酵过程以供生产发酵产物的真菌。很多种类的丝状真菌以及酵母用于所述过程中。优选的丝状真菌宿主细胞可选自以下属：曲霉属、木霉属、腐质霉属、枝顶孢属、铼孢属、根霉属（Rhizopus)、被孢霉属（Mortierella)、青霉属、毁丝霉属（Myceliophthora)、金孢子菌属（Chrysosporium)、毛霉属、类壳属 (Sordaria)、脉孢菌属、粪壳菌属（Podospora)、红曲霉属（Monascus)、伞菌属（Agaricus)、密孔菌属（Pycnoporus)、裂槽菌属（Schizophylum)、栓菌属（Trametes)以及黄孢原毛平革菌属（Phanerochaete)。可用作宿主细胞、例如参考宿主细胞以便比较转化与未转化细胞的发酵特征的优选真菌菌株包括例如黑曲霉（Aspergillus niger)CBS120. 49、CBS 513. 88,米曲霉（Aspergillus oryzae)ATCC16868、ATCC 20423、IFO 4177、ATCC 1011、 ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892,烟曲菌（Aspergillus fumigatus) AF293(CBS101355)，黄青霉 CBS 455. 95、橘青霉（Penicillium citrinum)ATCC 38065、黄青霉 P2，顶头抱霉（Acremonium chrysogenum)ATCC 36225、ATCC 48272，里氏木霉 (Trichoderma reesei)ATCC 26921、ATCC 56765、ATCC 26921，酱油曲霉（Aspergillus sojae)ATCC 11906，Chrysosporium lucknowense ATCC44006 以及所有这些菌株的衍生物。特别优选作为丝状真菌宿主细胞的是黑曲霉CBS 513.88以及其衍生物。
[0241] 任何适合的酵母可选择作为宿主细胞。优选的酵母宿主细胞可选自以下属：酵母属（Saccharomyces)(例如酿酒酵母、贝酵母（S.bayanus)、巴氏酵母（S.pastorianus)、卡氏酵母（S.carlsbergensis))、克鲁维酵母菌属（Kluyveromyces)、假丝酵母属（Candida) (例如C. revkaufi、铁红假丝酵母（C. pulcherrima)、热带假丝酵母（C. tropicalis)、产朊假丝酵母（C. utilis))、毕赤酵母属（Pichia)(例如巴斯德毕赤酵母（P. pastoris))、裂殖酵母属（Schizosaccharomyces)、汉森酵母属（Hansenula)、克勒克酵母属（Kloeckera)、许旺酵母属（Schwanniomyces)以及耶罗威亚酵母属（Yarrowia)(例如解脂耶罗威亚酵母 (Y.lipolytica)(先前归类为解脂假丝酵母菌（Candida lipolytica))。
[0242] 任何适合的原核生物可选择作为宿主细胞。可选择革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于杆状细菌（例如枯草芽孢杆菌（B.subtilis)、禾谷巨大芽抱杆菌（B.megaterium))、不动杆菌（Acinetobacter bacteria)、诺卡氏菌（Norcardia baceteria)、黄色杆菌（Xanthobacter bacteria)、弗氏埃希菌（Escherichia bacteria) (例如大肠杆菌（例如菌株 DH 1 0B、Stbl2、DH5- α、DB3、DB3. 1)、DB4, DB5、JDP682 以及 ccdA-over (例如美国申请No. 09/518, 188)))、链霉菌、欧文氏菌、克雷伯氏菌、沙雷氏菌 (例如粘质沙雷氏菌（S.marcessans))、假单胞菌（例如铜绿假单胞菌（P. aeruginosa))、沙门氏菌（例如鼠沙门氏伤寒杆菌（S.typhimurium)、伤寒杆菌（S.typhi))。细菌还包括但不限于光合细菌（例如绿色非硫细菌（例如绿弯菌（例如C. aurantiacus)、绿丝菌（例如C. gigateum))，绿色硫菌（例如绿硫细菌（例如C. limicola)、突柄绿菌（例如 P. luteolum))，紫色硫菌（例如紫硫细菌（例如傲氏着色菌（C. okenii)))以及紫色非硫菌 (例如红螺菌（例如深红红螺菌（R. rubrum))、红细菌（例如类球红细菌（R. sphaeroides)、荚膜红细菌（R. capsulatus))以及红微菌（例如R. vanellii))。
[0243] 来自非细菌生物的细胞可用作宿主细胞。所述细胞的实例包括但不限于昆虫细胞 (例如果蝇（例如黑腹果蝇（D.melanogaster))、灰夜蛾（例如草地贪夜蛾（S. frugiperda) Sf9或Sf21细胞）以及粉斑蛾（例如High-Five细胞）；线虫细胞（例如秀丽隐杆线虫 (C. elegans)细胞）；禽类细胞；两栖动物细胞（例如非洲爪蟾（Xenopus laevis)细胞）；爬虫类动物细胞；以及哺乳动物细胞（例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、 Bowes黑色素瘤以及HeLa细胞）。
[0244] 在本发明中适用作宿主细胞的微生物或细胞可商购获得。
[0245] 真核细胞具有至少两个独立的途径（一个经由同源重组（HR)，并且一个经由非同源重组（NHR))，通过这两个途径核酸（特别是DNA)可整合到宿主基因组中。酿酒酵母为优先同源重组（HR)的生物体。此生物体的非同源与同源重组的比率（NHR/HR)可在约0.07 至0.007之间变化。
[0246] W0 02/052026公开酿酒酵母的突变体，其具有改善的DNA序列靶向到其基因组的效率。所述突变体株缺乏NHR中涉及的基因（KU70)。
[0247] 与酿酒酵母不同，最高等的真核生物如丝状真菌细胞至哺乳动物细胞优先NHR。在丝状真菌中，NHR/HR比率在1与大于100之间的范围内。在所述生物体中，靶向的整合频率相当低。
[0248] 这样，为改善多核苷酸在靶位点组装的效率，优选在根据本发明的方法中提高宿主细胞中同源重组（HR)的效率。
[0249] 因此，优选地在根据本发明的方法中，宿主细胞的同源重组（HR)的效率被优选地诱导型地增大。
[0250] 因为NHR与HR途径互相关联，因此HR的效率可通过调节一个或两个途径来增大。增大HR部件的表达将增大HR的效率，并且降低NHR/HR的比率。降低NHR部件的表达也将降低NHR/HR的比率。根据本发明的载体-宿主系统的宿主细胞中HR效率的增大优选描述为NHR/HR比率的降低，并且优选相对于亲本宿主细胞来进行计算，在所述亲本细胞中HR和 /或NHR途径未经过调节。HR与NHR的效率可通过所属领域的技术人员可用的不同方法来测量。优选方法包括测定单一载体构建体在亲本与经过调节的宿主细胞中的靶向整合和异位整合的效率。然后可针对两种细胞类型技术NHR/HR的比率。随后，可计算NHR/HR比率的下降。在W02005/095624中，全面描述了这种优选方法。
[0251] 与亲本细胞相比，具有降低的NHR/HR比的宿主细胞可通过增大HR途径的效率和 /或通过增大NHR途径的效率来修饰基本真核细胞来获得。优选地，NHR/HR比率因而降低至少两倍、优选至少4倍、更优选至少10倍。优选地，与亲本宿主细胞相比，在根据本发明的载体-宿主系统的宿主细胞中NHR/HR比率降低至少5%、更优选至少10%、甚至更优选至少20 %、甚至更优选至少30 %、甚至更优选至少40 %、甚至更优选至少50 %、甚至更优选至少60%、甚至更优选至少70%、甚至更优选至少80%、甚至更优选至少90%并且最优选至少100%。
[0252] 根据一个实施方式，通过增大HR部件的表达水平降低NHR/HR的比率。HR部件为所属领域的技术人员所熟知。HR部件在本文中定义为在控制多核苷酸靶向整合到宿主的基因组中涉及的所有基因和元件，所述多核苷酸与宿主基因组的某预定位点具有一定同源性，其中整合是靶向的。
[0253] 可通过降低NHR部件的表达水平来降低NHR/HR的比率。NHR部件在本文中定义为在控制多核苷酸整合到宿主的基因组中涉及的所有基因和元件，而不考虑所述多核苷酸与宿主的基因组序列的同源性程度。NHR部件为所属领域的技术人员所熟知。优选的NHR 部件为选自以下的部件：在NHR途径中涉及的酵母基因的根据本发明的载体-宿主系统的宿主细胞的同源物或直向同源物：KU70、KU80、RAD50、MRE11、XRS2、LIG4、LIF1、NEJ1以及 SIR4 (van den Bosch 等人，2002, Biol. Chem. 383 :873-892 ;以及 Allen 等人，2003，]?〇1· Cancer Res. 1 :913-920)。最优选为以下中的一个：KU70、KU80 和 LIG4,以及 KU70 与 KU80 二者。可使用如本文所述的用于获得必要基因的缺乏的方法实现NHR部件的表达水平的降低。
[0254] 由于降低NHR中涉及的部件的表达有可导致不利表型作用，因此优选在根据本发明的载体-宿主系统的宿主细胞中，同源重组效率的增大是可诱导的。这可通过所属领域的技术人员已知的方法来实现，例如通过使用针对NHR部件的可诱导过程（例如，通过将 NHR部件放置在可诱导启动子之后）或通过使用NHR部件的瞬时破坏，或通过将编码NHR部件的基因放回到基因组中。
[0255] 在本发明中，可使用标记物基因（或选择标记物或标记物等）。可使用任何适合的标记物基因，并且熟知所述基因是用来确定核酸是否包含在细胞中。根据本发明制备的组装的多核苷酸可包含两种或更多种标记物基因，其中在一种标记物基因在一种生物体中有效地起作用，并且另一种标记物基因在另一生物体中有效地起作用。
[0256] 标记物基因的实例包括但不限于（1)编码提供针对否则有毒的化合物的抗性的产物（例如抗生素）的核酸片段；(2)编码否则在受体细胞中缺少的产物（例如必要产物、tRNA基因、营养缺陷标记物）的核酸片段；（3)编码抑制基因产物的活性的产物的核酸片段；(4)编码可易于鉴别的产物（例如表型标记物，如抗生素抗性标记物（例如β -内酰胺酶）、β_半乳糖苷酶、荧光或其它有色标记物，如绿色荧光蛋白（GFP)、黄色荧光蛋白 (YFP)、红色荧光蛋白（RFP)和青色荧光蛋白（CFP)，以及细胞表面蛋白）的核酸片段；（5) 结合否则对细胞存活和/或功能有害的产物的核酸片段；(6)以其它方式抑制的如以上1-5 中所述的任何核酸片段的活性的核酸片段（例如反义寡核苷酸）；（7)结合修饰底物的产物 (例如限制内切酶）的核酸片段；(8)可用于分离或鉴别期望分子（例如特定蛋白结合位点）的核酸片段；(9)编码否则可为非功能性的特定核苷酸序列（例如，分子亚群的PCR扩增）的核酸片段；（10)当不存在时直接或间接赋予对具体化合物的抗性或敏感性的核酸片段；（11)编码在受体细胞中的有毒或将相对无毒性的化合物转化为毒性化合物的产物（例如单纯疱疹-胸腺激酶、胞嘧啶脱氨酶）的核酸片段；（12)抑制含有其的核酸分子的复制、分割或遗传力的核酸片段；（13)编码条件性复制功能的核酸片段，例如在某些宿主或宿主细胞株中或在某些环境条件下（例如温度、营养条件等）进行复制；和/或优选为以下的必要基因：尚未示出非必要性的基因，更优选地，缺乏致使宿主细胞不能生存的基因。更优选地，必要基因为缺乏致使宿主细胞在所有条件下并且在任何培养基、特别是复杂（未定义）培养基上均不能生存的基因。在本发明的背景下必要基因可为当已使得另一（非必要）基因缺乏时使得宿主细胞不能生存的基因。
[0257] 当显示出某一水平的相似性时，认为氨基酸或核苷酸序列是同源的。两个序列同源指示共同进化起源。两个同源序列是紧密相关还是更远地相关由分别为高或低的"同一性百分比"或"相似性百分比"来指示。虽然有争议，但应指出频繁地可互换地使用"同一性百分比"或"相似性百分比"、"同源程度"或"同源百分比"。出于本发明的目的，可使用数学算法完成两个序列之间的序列比较和同一性百分比的确定。所属领域的技术人员应意识到以下事实：数种不同的计算机程序可用于比对两个序列并且测定两个序列之间的同源性（Kruskal，J.B. (1983) An overview of sequence comparison，见 D.Sankoff 和 J. B. Kruskal,(编），Time warps, string edits and macromolecules ：the theory and practice of sequence comparison,第 1-44 页 Addison Wesley)〇
[0258] 可使用比对两个序列的Needleman和ffunsch算法测定两个核酸或氨基酸序列之间的同一性百分比（Needleman，S.B.和 Wunsch，C.D· (1970) J. Mol. Biol. 48,443-453)。所述算法比对氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已经在计算机程序 NEEDLE中执行。出于本发明的目的，使用来自EMBOSS包的NEEDLE算法（2. 8. 0版或更高版， EMBOSS :欧洲分子生物学开放软件套件（The European Molecular Biology Open Software Suite) (2000)Rice，P.Longden，I.和 Bleasby，A. Trends in Genetics 16，（6)第 276-277 页，http ://emboss. bioinformatics· nl/)。对于蛋白质序列，EBL0SUM62 可用于取代矩阵。对于核苷酸序列，可使用EDNAFULL。可指定其它矩阵。用于比对氨基酸序列的任选参数为空位开放罚分10和空位扩展罚分0. 5。所属领域的技术人员应理解所有这些不同参数将得到略微不同的结果，但当使用不同算法时两个序列的总同一性百分比不会显著改变。
[0259] 同源性或同一性为两个完整序列之间的在包括任何空位或扩展的总比对区上的一致匹配的百分比。两个比对序列之间的同源性或同一性可计算如下：比对中在两个序列中示出一致氨基酸或核酸残基的对应位置的数量除以包括空位的比对的总长度。如本文所定义的同一性可由NEEDLE获得并且在程序的输出中标记为"同一性（IDENTITY) "。
[0260] 两个比对序列之间的同源性或同一性可计算如下：比对中在两个序列中示出一致氨基酸或核酸残基的对应位置的数量除以减去排列中的总空位数量后排列的总长度。如本文所定义的一致性可使用N0BRIEF选项由NEEDLE获得并且在程序的输出中标记为"最长同一性（longest-identity)，'。
[0261] 序列同一性还可通过在严谨条件下进行的杂交测定来确定。如本文所用，术语"严谨条件"是指杂交和洗涤条件。杂交条件为所属领域的技术人员所已知，并且可见Current Protocols in Molecular Biology，John Wiley&Sons，N.Y·，6. 3. 1-6. 3. 6 (1989)。在所述文献中描述了水性和非水性方法，并且可使用任一种。严谨杂交条件的实例为在6X氯化钠 /柠檬酸钠（SSC)中在约45°C下杂交，接着在0. 2X SSC、0. 1% SDS在50°C下洗涤一次或多次。严谨杂交条件的另一实例为在6X氯化钠/柠檬酸钠（SSC)中在约45°C下杂交，接着在0. 2X SSC、0. 1%SDS在55°C下洗涤一次或多次。严谨杂交条件的另一实例为在6X氯化钠/柠檬酸钠（SSC)中在约45°C下杂交，接着在0.2X SSC、0.1%SDS在60°C下洗涤一次或多次。通常，严谨杂交条件为在6X氯化钠/柠檬酸钠（SSC)中在约45°C下杂交，接着在0. 2X SSC、0. 1%SDS在65°C下洗涤一次或多次。更通常，严谨条件为0. 5 Μ磷酸钠、7% 305、651：，接着在0.2乂35(：、0.1%305在651：下洗涤一次或多次。
[0262] 本文中对专利文献或作为现有技术给出的其它事物的引用不应视为承认文献或事物为已知的或其所含的信息为任一权利要求的优先权日:时的一般常识的一部分。
[0263] 本文阐述的各参考文献的公开内容是以引用的方式全部整合本文中。
[0264] 通过以下实施例来进一步说明本发明。实施例
[0265] 概沭
[0266] 标准遗传技术如酶在宿主细胞中的过度表达以及宿主细胞的另外遗传修饰在所属领域中是已知的方法，如在Sambrook和Russel (2001)" Molecular Cloning: A Laboratory Manual (第三版），Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press ;或 F. Ausubel 等人编，"Current protocols in molecular biology" , Green Publishing and Wiley Interscience, New York(1987)中所述。
[0267] 从酵母分离染色体DNA
[0268] 使酵母细胞在旋转振荡器中在含2%葡萄糖的YEP培养基中生长（过夜、在30°C 和280 rpm)。将1.5 ml这些培养物转移至埃彭道夫离心管（eppendorf tube)并且在最大速度下离心1分钟。倾倒出上清液并且使沉淀再悬浮在200 μ 1 YCPS(含0.1 % SB3-14(Sigma Aldrich，荷兰）的 10 mM Tris.HCl pH 7.5、1 mM EDTA)以及 Ιμ? 核糖核酸酶（20 mg/ml核糖核酸酶Α，来自牛胰腺，Sigma，荷兰）中。将细胞悬浮液在65°C下孵育 10分钟。将悬浮液在埃彭道夫离心机中在7000 rpm下离心1分钟。丢弃上清液。将沉淀小心溶解在200μ 1 CLS(25mM EDTA、2% SDS)以及1 μ 1核糖核酸酶A中。在65°C下孵育 10分钟后，将悬浮液在冰上冷却。添加70 μ 1 PPS (10 Μ乙酸铵）之后，将溶液在旋涡混合器上彻底混合。离心（在埃彭道夫离心机中在最大速度下5分钟）后，将上清液与200 μ 1 冰冷异丙醇混合。DNA容易地沉积并且通过离心（5分钟，最大速度）来粒化。用400 μ 1冰冷的70%乙醇洗涤沉淀。在室温下干燥沉淀并且溶解在50μ1 TE(10 mM Tris.HCl ρΗ7. 5， ImM EDTA)中。
[0269] 用于 Rasamsonia emersonii 的一般方法
[0270] 菌株
[0271] Rasamsonia (Talaromyces) emersonii 菌株 TEC-142 于 2009 年 7 月 1 日保藏在CENTRAALBUREAUV00RSCHIMMELCULTURES，Uppsalalaan8，邮箱85167，NL-3508 AD Utrecht，The Netherlands，保藏登记号为 CBS 124902。TEC-142S 为 TEC-142 的单一分离物。
[0272] 其它适合的菌株如以上所述的菌株可同等地用在本发明的实施例中，以便示出本发明的作用和优势。例如TEC-101、TEC-142、TEC-192、TEC-201或TEC-210为适合的 Rasamsonia 菌株，其描述于 W02011/000949 中。
[0273] 培养基和溶液
[0274] 马钤薯右旋糖掠脂，PDA(Fluka,目录号70139):毎升：马钤薯提取物4g ;右旋糖 2〇g ;细菌培养用琼脂15g ;ρΗ5· 4 ;在120°C下灭菌20分钟。
[0275] Rasamsonia掠脂培养基：每升：盐部分编号3 15g ;纤维素30g ;细菌培养用蛋白胨 7. 5g ;谷粉 15g ;KH2P04 5g ;CaC12. 2aq lg ;细菌培养用琼脂 20g ;ρΗ6· 0 ;在 120°C下灭菌20分钟。
[0276] 盐部分纟目成："盐部分编号3"符合W098/37179表1的公开内容。与此表的组成的偏差为 CaC12.2aq 1.0g/l、KCl 1.8g/L、柠檬酸 laq 0.45g/L(螯合剂）。
[0277] 用于Rasamsonia的摇瓶培养基
[0278] Rasamsonia 培养基 1 :每升：葡萄糖 20g ;酵母提取物（Difco) 20g ;Clerol FBA3107(AF)4 滴；MES 30g ;ρΗ6· 0 ;在 120°C下灭菌 20 分钟。
[0279] Rasamsonia 培养某 2 :毎升：盐部分编号 3 10g ;葡萄糖 10g ;KH2P04 5g ;NaH2P04 2g ; (NH4) 2S04 5g ;MES 30g ;ρΗ5· 4 ;在 120°C下灭菌 20 分钟。
[0280] Rasamsonia 培养某 3 :毎升：盐部分编号 3 10g ;纤维素 20g ;KH2P04 5g ;NaH2P04 2g ; (NH4) 2S04 5g ;MES 30g ;ρΗ5· 4 ;在 120°C下灭菌 20 分钟。
[0281] Rasamsonia培养基4 :每升：盐部分编号3 10q ;纤维素15g ;葡萄糖5g ;KH2P04 5g ;NaH2P04 2g ; (NH4)2S04 5g ;MES 30g ;ρΗ5· 4 ;在 120°C下灭菌 20 分钟。
[0282] Rasamsonia的孢子分批制剂
[0283] 使菌株在直径10cm的培养皿中在40°C下自Rasamsonia琼脂培养基上从吧备物生长5-7天。对于MTP发酵，使菌株在含有Rasamsonia琼脂培养基的96孔板中生长。将菌株贮备物在_80°C下储存在10%甘油中。
[0284] 染色体DNA分离
[0285] 使菌株在￥66培养基（每升：881((：1、168葡萄糖.!120,2〇111110%酵母提取物、 10ml lOOx pen/strep、6.66g YNB+氛基酸、1.5g朽1 樣酸以及6g K2HP04)中在42°C、250rpm 下生长16小时，并且使用DNeasy植物小型试剂盒（Qiagen，Hilden，Germany)分离染色体 DNA。
[0286] Rasamsonia的摇瓶生长方案
[0287] 将孢子接种在含有20 ml Rasamsonia培养基1的100 ml摇瓶中，并且在45°C、 250 rpm下在孵育振荡器中孵育1天（预培养物1)，将1或2 ml的生物质从预培养物1转移至含有20 ml Rasamsonia培养基2的100 ml摇瓶中，并且在如以上所述的条件下生长1 天（预培养物2)。随后，将1或2 ml的生物质从预培养物2转移至含有20 ml Rasamsonia 培养基3或4的100 ml摇瓶中，并且在如以上所述的条件下生长3天。
[0288] 蛋白质分析
[0289] 在还原条件下在 NuPAGE 4-12 % Bis-Tris 凝胶（Invitrogen，Breda，荷兰）上制备蛋白质样品并且染色。将凝胶用InstantBlue(Expedeon，Cambridge, United Kingdom)、 SimplyBlue safestain(Invitrogen, Breda, The Netherlands)或 Sypro Ruby(Invitrogen，Breda, The Netherlands)根据制造商的说明书进行染色。
[0290] 总蛋白含量
[0291] 根据布拉德福（Bradford)法测定所回收上清液的蛋白含量。用布拉德福蛋白测定使用考马斯（Coomassie)蛋白试剂测定酶样品中的蛋白量。将25 μ 1适当稀释的酶样品与1. 2 ml考马斯试剂混合。在室温下10分钟后，使用分光光度计（Uvikon XL)测定混合物在595 nm下的吸光度。与BSA标准相比较来计算蛋白含量。
[0292] 玉米秸杆测定
[0293] 为了测量纤维素酶活性，进行玉米秸杆活性测定。在空菌株和转化株的上清液中 (其中培养细胞的培养液的液体部分）测量纤维素酶活性。
[0294] 制各预处理的玉米秸轩底物
[0295] 如 Schell，D. J.，Applied Biochemistry and Biotechnology (2003)，第 105-108 卷，第69-85页所述获得稀酸预处理的玉米秸杆。使用在190°C、1分钟停留时间以及在液相中1.45% (w/w)有效H2S04酸浓度的稳态条件下操作的试验性规模的预处理反应器。
[0296] 在2%未洗涤的酸预处理的玉米秸轩h测量纤维素酶活件
[0297] 由于纤维素酶的葡萄糖释放不是组合物中酶的量的线性函数，换句话说，在固定的时间点两倍的酶量不会自动产生两倍的葡萄糖量。因此，在基于剂量应答的测定中评价了纤维素酶混合物的活性，其中剂量是基于每单位所测试纤维素混合物相等量的蛋白。
[0298] 用未洗涤的酸预处理的玉米秸杆作为底物测量混合物的总纤维素酶活性。将冷冻的酶样品解冻，在pH 4. 5的50 mM柠檬酸盐缓冲液中逐步按两倍进行范围从未稀释至高达 32倍的一系列6个稀释。
[0299] 将200 μ 1样品转移至含有800 μ L于50 mM柠檬酸盐缓冲液（缓冲在pH4. 5)中酸预处理玉米秸杆的2. 5% (w/w)干物质的小瓶中。将另外200 μ 1样品转移至含有800 μ 1 的50 mM柠檬酸盐缓冲液（缓冲在pH 4. 5)的称为空白的小瓶中。另外，通过用200 μ 1的 50 mM柠檬酸盐缓冲液孵育800 μ 1的在50 mM柠檬酸盐缓冲液（缓冲在pH 4. 5)中酸预处理玉米秸杆的2.5% (w/w)干物质来测定玉米秸杆的糖背景值。所有小瓶均在65°C下孵育 72 h〇
[0300] 孵育后，将100 μ 1内标溶液（20 g/L马来酸，于D20中40 g/L EDTA)添加至小瓶。将含有预处理的玉米秸杆的所有小瓶在5300 g下离心30分钟，并且随后将600 μ 1上清液转移至含有400μ1 H20/D20 9 : 1的新小瓶。
[0301] 使用具有水抑制的脉冲程序，在27°C的温度下，在于500 MHz的质子频率下操作的Avance III Bruker上记录ID 1H-NMR光谱。相对于与6.30ppm的内标信号有关的4， 4-二甲基-4-硅杂戊烷磺酸，基于5. 20 ppm的信号进行葡萄糖量化（任意单位）。通过酶溶液中存在的残余糖（由空白测量）和酸预处理的玉米秸杆中存在的残余糖来校准在样品中测量的葡萄糖，来计算相对葡萄糖释放（AGlc)。
[0302] 由于样品的蛋白质浓度是已知的，因此糖释放可描述为所测试的稀释样品的蛋白质mg/ml与在时间点72小时的相对葡萄糖释放的函数。
[0303] 实施例1 :酵母的标准化的涂径构筑系统
[0304] 1. 1酵母的标准化的涂径构筑系统的一般介绍
[0305] 此方法使得能够以大的灵活性将基因/途径快速引入酵母（酿酒酵母）基因组中。水平一（参见图9)聚焦于使用称为"Golden Gate克隆"的方法（Engler C.等人（2008) PLoS ONE 3(11) :e3647 以及Engler C.等人（2009)PL〇S ONE 4(5) :e5553)，将所谓的标准化的遗传元件、启动子、开放阅读框架（〇RF)以及终止子克隆到侧翼为标准化的50 bp连接物的功能性表达盒中。
[0306] 标准化的50 bp连接物为骨架进入载体的一部分并且在水平二使用（参见图9)，其中标准化的50 bp连接物提供多个表达盒之间的必要同源性，使得其经由体内同源重组作为途径构筑并整合到酵母基因组中。
[0307] 期望的遗传元件（例如启动子、开放阅读框架（0RF)以及终止子）的设计的标准化与标准化的连接物的使用相结合在克隆和转化过程中实现最大速度和灵活性。
[0308] 图9为标准化的途径构筑方法的示意性图示。在本文所述的实施例中，使用所述方法来测定一组启动子和终止子对五种所选报道基因的表达的影响。
[0309] 1. 2 it.i十遗.传元件启动子、0RF以及终ih子
[0310] 根据标准设计各遗传元件，使得可以用IIs型限制酶Bsal将元件克隆到载体中，因而产生包含启动子、0RF以及终止子的功能性表达盒。
[0311] 首先，通过引入点突变，使所有元件的内部Bsal位点去除。对于0RF，避免氨基酸序列变化。对于启动子和终止子，选择点突变以不影响（就我们所知）元件的功能性。各元件在两侧提供有4nt桥与Bsal识别位点的组合。Bsal识别位点放置成使得用IIs型限制酶切割产生标准化的4核苷酸伸出序列，其称为"桥"。以此方式，设计了 30个启动子（SEQ ID N0 :1 至 30)、5 个 0RF(报道基因；SEQ ID N0 :31 至 35)以及 14 个终止子（SEQ ID N0 : 36至49)的组。下文更详细地描述针对各元件的具体规则，以针对启动子的规则开始，接着是0RF和终止子。
[0312] 启动子的具体设计规则
[0313] -如以上所述，从启动子序列去除所有Bsal位点
[0314] -对于大部分启动子,标准化的大小设定为600个碱基对；例外为先前已示出更大或更短启动子为较佳选择或历史上已设定为某一长度的情况。
[0315] -序列
[0316] 5 ' GGTCTCGGTGC+ (启动子序列-最后 bp) +AATGGGAGACC 3 '
[0317] -在启动子的5'部分的GTGC(加下划线）为至骨架进入载体的4核苷酸序列桥 (1.3中进行讨论）
[0318] -在启动子的3'部分的AATG(加下划线）为至0RF的4核苷酸序列桥，其中ATG 为0RF的起始密码子并且AATG的第一个A为启动子序列的标准化的最后碱基对A
[0319] 0RF的具体设计规则
[0320] -从0RF序列去除所有Bsal位点
[0321] -序列
[0322] 5，GGTCTCGAATG+ (0RF 序列）+TAAAGGAGACC 3 '
[0323] 0RF序列没有终止和起始密码子（包括在4 nt桥中）
[0324] -在0RF的5'部分的AATG(加下划线）为至启动子序列的4核苷酸桥
[0325] -在0RF的3'部分的TAAA(加下划线）为至终止子序列的4核苷酸桥
[0326] 终止子的具体设计规则
[0327] -从终止子序列去除所有Bsal位点
[0328] -序列
[0329] 5 ' GGTCTCGTAAA+ (终止子序列）+CCTCGGAGACC
[0330] -在终止子的5'部分的TAAA(加下划线）为至0RF序列的4核苷酸桥
[0331] -在终止子的3'部分的CCTC(加下划线）为至骨架进入载体的4核苷酸桥（在 1. 3中讨论）
[0332] 通过DNA2. 0 (Menlo Park，CA USA)在具有大肠杆菌氨比西林抗性标记物的标准载体中合成并克隆所有遗传元件（启动子、0RF以及终止子）。DNA2. 0使用的标准大肠杆菌克隆载体在SEQ ID N0 :50中阐述。
[0333] 1. 3设计骨架讲入载体
[0334] 骨架进入载体构建成具有两个Bsal位点，其在切割后产生克隆至表达载体中（即组装的启动子、0RF以及终止子组合）的4核苷酸桥/粘性端。为改善Golden Gate克隆反应的效率，将用于在大肠杆菌中逆选择的ccdB基因定位在Bsal位点之间。这防止选择原始骨架载体。此外，骨架进入载体具有用于骨架质粒在大肠杆菌中的增殖的卡那霉素选择标记物，这与用于含有输入元件（启动子、ORF以及终止子）的载体的氨比西林标记物不同。因此，使用对卡那霉素的选择来防止对元件载体的不需要的选择。
[0335] 骨架进入载体的另一重要特征为标准化的50bp序列，其称作"连接物"。连接物提供用于在标准化的途径构筑方法的水平2进行重组所必要的同源性。连接物侧翼为4nt 桥，其方式使得在载体中克隆启动子、0RF以及终止子后，所产生的表达盒左和右侧翼为连接物。
[0336] 称为连接物5、连接物A至连接物K以及连接物3 (SEQ ID N0 :51至63)的十三个独特50 bp连接物设计成对酵母基因组不含任何同源性的随机序列。这些连接物序列用来设计表1中所列的22个骨架载体。
[0337] 表1 :具有连接物的所有骨架讲入载体和对应SEQ ID识别符
[0338] 骨架进入载体迮接物 SEQIDNO Sc Sa.bbn 左连接物5 +心连接物a SEQ ID NO: 64 Scab.bbn 左连接物a 右连接物b SE〇 ID NO: 65 Scbc.bbn 左连接物b 右连接物c SEQ ID NO: 66 Sccd.bbn 左连接物e 右连接物d SEQ ID NO: 67 Scde.bbn 左连接物d 右连接物e SEQ ID NO: 68 Sc ef'bbn 左连接物e 右连接物f SEQ ID NO: 69 Sc fg.bbn 左连接物f 右连接物g SEQ ID NO: 70 Sc gh.bbn 左连接物g 右连接物h SEQ ID NO: 71 Sc hi.bbn 左连接物h +右连接物i SEQ ID NO: 72 Sc ij.bbn 左连接物? 右连接物j SEQ ID NO: 73 Scjk.bbn 左连接物j 右连接物k SEQ ID NO: 74 Sc a3.bbn 左连接物a 右连接物3 SEQ ID NO: 75
[0339] Sc b3.bbn 左连接物b 右连接物3 SEQ ID NO: 76 Sc c3.bbn +/r:连接物 c 心连接物 3 SEQ ID NO: 77 Sc d3.bbn +/!':连接物 d 心连接物 3 SEQ ID NO: 78 Sc e3.bbn +/n连接物 e -心'连接物 3 SEQ ID NO: 79 ScO.bbn 左连接物f +心连接物3 SEQ ID NO: 80 Scg3.bbn 左连接物g 右连接物3 SEQ ID NO: 81 Sc h3.bbn 左连接物h 右连接物3 SEQ ID NO: 82 Sc i3.bbn 左连接物i 右连接物3 SEQ ID NO: 83 Scj3.bbn 左连接物j 右连接物3 SEQ ID NO: 84 Sc k3.bbn 左连接物k 右连接物3 SEQ D NO: 85
[0340] SEQ ID NO :64至85中所列的序列为通过DNA2.0合成并且克隆到标准大肠杆菌载体中以产生骨架载体的具体序列。用于克隆SEQ ID N0 :64至85的大肠杆菌载体含有卡那霉素标记物，且其序列示于SEQ ID N0:86。
[0341] 骨架载体实现两个重要的供能。一，其含有至启动子和终止子的桥，从而使得有可以在Golden Gate反应中使环闭合。二，其用连接物修饰表达盒，以用于体内重组步骤（称为水平2)。例如，在Sc 5A.bbn中用Golden Gate反应克隆表达盒将在表达盒的左部分装备连接物5并且在右部分装备连接物A。表1中所列的具有所设计连接物的骨架进入载体的组在DNA2.0 (Menlo Park，CA USA)定制并合成。在下文总结骨架进入载体的所有特征。
[0342] 总结骨架的具体设计
[0343] -大肠杆菌载体序列具有卡那霉素标记物（SEQ ID NO :86)
[0344] -两个Bsal位点，其在切割后产生与启动子的5'和终止子的3'上的桥相容的4 nt桥
[0345] -用定位在Bsal位点之间的ccdB序列逆选择
[0346] -连接物序列在桥左和右
[0347] -通过DNA2. 0在载体中定制并克隆的实际序列的设计：5' L con-GTGCGGAGACC-ccdB 序列-GGTCTCGCCTC-R con 3，
[0348] 〇 GTGC(加下划线）至启动子的5'部分的桥
[0349] 〇 CCTC(加下划线）至终止子3'部分的桥
[0350] 〇 "L con"和"R con"分别为左连接物序列和右连接物序列
[0351] 1. 4用Golden Gate克降组装表汰念
[0352] 按照 Golden Gate 克隆的出版物（Engler C.等人（2008) PLoS ONE 3(11) :e3647 以及Engler C.等人（2009)PL〇S ONE 4(5) :e5553)中所描述的进行组装。在单锅反应中，与三元件输入载体以及骨架进入载体组合添加 Bsal和连接酶。最优选的反应条件为37°C 下2分钟并且16°C下5分钟的50个循环的反应。通常地，通过对完整插入物测序来检查2 个克隆。当示出两个克隆均不正确时，用测序来检查其它克隆。所有组装的表达盒的列表可见表2。

【权利要求】
1. 一种用于制备两种或更多种标准化的表达盒的方法，所述方法包括： a. 提供两组或更多组元件序列，每组元件序列一起构成至少一种功能性表达盒，各元件序列的两侧侧翼为IIs型限制核酸内切酶切割位点，之后是其识别位点，所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得元件序列的组可组装成功能性表达盒； b. 提供至少两种骨架进入载体，各骨架进入载体按以下这种顺序包含：（i)限制酶切割位点与其识别位点，和第一连接物序列（LF) ;(ii)包含可选择标记基因的载体骨架；以及（iii)第二连接物序列（RF)，和限制酶识别位点与其切割序列；以及（iv)任选地，在（i)和（iii)的所述识别位点之间的插入物，任何骨架进入载体上的所述连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装；以及 c. 使用基于使用限制酶消化和经由切割位点连接的方法，在至少两个骨架进入载体中组装所述两组或更多组元件序列作为功能性表达盒；从而制备两种或更多种标准化的表达盒。
2. -种用于在宿主细胞中在靶位点处体内重组两种或更多种标准化的表达盒的方法，所述方法包括： a. 根据权利要求1所述的方法制备两种或更多种标准化的表达盒，其中： i. RF和LF连接物序列包含同源重组序列；以及 ii. 任何骨架进入载体上的RF和LF连接物序列被选择成使得其可通过体内重组分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及 b. 从包含所述LF和RF序列的骨架进入载体回收表达盒；以及 c. 在宿主细胞中在靶位点处将所回收的表达盒彼此体内重组。
3. -种用于在宿主细胞中在靶位点处将两种或更多种标准化的表达盒体内重组的方法，所述方法包括： a. 根据权利要求1所述的方法制备两种或更多种标准化的模块式表达盒，其中： i. RF和LF连接物序列包含至少约9个碱基对的同源序列；以及 ii. 任何骨架进入载体上的RF和LF连接物序列被选择成使得其可使用这些序列通过体外方法分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及 b. 从骨架进入载体回收表达盒，并且通过LF和RF序列的体外连接对其进行组装；以及 c. 在宿主细胞中在靶位点处将所组装和回收的表达盒体内重组。
4. 根据前述权利要求中任一项所述的方法，其中至少两个骨架进入载体按以下这种顺序包含：（i) II型限制酶识别位点，之后是其切割位点，和至少25个碱基对的第一连接物序列（LF) ;(ii)包含可选择标记基因的载体骨架；以及（iii)至少25个碱基对的第二连接物序列（RF)，和II型限制酶的另一切割位点，之后是所述切割位点的识别位点；以及（iv)任选地，在（i)和（iii)的所述识别位点之间的插入物。
5. 根据权利要求2至4中任一项所述的方法，其中在两个整合序列存在下进行所述重组步骤，其中一个与第一表达盒和靶位点的侧翼序列重组，并且其中第二个与第二表达盒和靶位点的另一侧侧翼序列重组。
6. 根据权利要求2至5中任一项所述的方法，其中，在所述重组步骤中，第一表达盒包含与靶位点的侧翼序列重组的整合序列，并且第二表达盒包含与靶位点的另一侧侧翼序列重组的整合序列。
7. 根据权利要求2或6中任一项所述的方法，其中所述整合序列包含与用于第二靶位点、任选地不同于所述第一靶位点的种类的宿主细胞中的位点重组的另外的序列。
8. 根据权利要求2至7中任一项所述的方法，其中所述整合序列介导经由同源重组或位点特异性重组的整合。
9. 根据权利要求7或8所述的方法，其中所述整合序列、连接物或其它元件序列包含用于与所述第二靶位点重组的位点特异性重组序列，所述序列位于所组装的表达盒之外并且允许使用位点特异性重组在所述第二靶位点处、任选地在不同于所述第一靶位点的宿主细胞种类的宿主细胞种类中的靶位点处进行重组。
10. 根据权利要求2至9中任一项所述的方法，其中在所述靶位点处按预定顺序顺次组装并重组两种或更多种表达盒。
11. 根据前述权利要求中任一项所述的方法，其中至少一种表达盒为标记物表达盒。
12. 根据权利要求11所述的方法，其中所述标记物表达盒的侧翼为至少两个位点特异性重组位点。
13. 根据权利要求2至12中任一项所述的方法，其中使用不根据权利要求1所述的方法制备的表达盒。
14. 根据前述权利要求中任一项所述的方法，其中至少两个元件序列组包含启动子元件、开放阅读框架元件以及终止子元件。
15. 根据前述权利要求中任一项所述的方法，其中将每组元件在至少两个骨架进入载体中组装成为功能性表达盒在单锅反应中进行。
16. 根据前述权利要求中任一项所述的方法，其中限定每组中的元件以使得按预定顺序组装所述表达盒。
17. -种用于在祀位点处整合DNA序列的方法，其包括： a. 提供：（i)至少约200个碱基对长的至少两个左（int-L)和两个右（int-R)整合序列的组，用于同源重组至宿主细胞中的至少一个靶位点，其中：所述左（int-L)序列侧翼为一个至少约25个碱基对的连接物序列；所述右（int-R)序列侧翼为一个至少约25个碱基对的连接物序列；以及 (ii)至少一个表达盒，其两侧侧翼为至少约25个碱基对的连接物序列；以及 b. 通过在所述int-L和int-R序列的同源靶位点处重组来体内组装来自步骤（a)的至少三个序列的组，以使得至少一个左和至少一个右整合序列按照这种顺序处于所述宿主细胞的祀位点处，其中体内组装后，至少一个表达盒存在于靶位点处，任选地所述表达盒能够表达功能性标记物。
18. 根据权利要求17所述的方法，所述方法包括： a. 根据权利要求1所述的方法制备两种或更多种标准化的模块式表达盒，其中 i. int-L和int-R序列为启动子、orf或终止子序列的一部分； ii. RF和LF连接物序列包含至少约25个碱基对的同源重组序列；以及 iii. 任何骨架进入载体上的RF和LF序列被选择成使得其可通过分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行体内重组来组装； b. 从包含LF和RF序列的所述骨架进入载体回收表达盒；以及 c. 在宿主细胞中在所述靶位点处将所回收的表达盒彼此体内重组。
19. 根据权利要求17或18所述的方法，所述方法包括选择两个或更多个int-L和两个或更多个int-R序列，用于在一组体内组装和重组反应中使用，从而产生多个宿主细胞，所述细胞具有通过所选择的int-L和int-R序列祀向至少两个允许的组合的组合，其中 a. 至少两个int_L序列在靶位点处在至少一个int-R序列的左侧；或 b. 至少两个int_R序列在靶位点处在至少一个int-L序列的右侧。
20. 根据权利要求17至19中任一项所述的方法，其中第二功能性标记物盒形成在第二革巴位点处。
21. 根据权利要求17至20中任一项所述的方法，其中在靶位点处的重组导致在所述靶位点处一个或更多个基因的功能性敲除或下调。
22. 根据权利要求2至21中任一项所述的方法，其中所述宿主细胞为原核或真核细胞。
23. -种用于制备两种或更多种标准化的表达盒的系统，所述系统包括： a. 两组或更多组元件序列；每组元件序列一起构成至少一种功能性表达盒，各元件序列的两侧侧翼为IIs型限制核酸内切酶切割位点，之后是其识别位点，所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得元件序列的组可组装成功能性表达盒； b. 至少两种骨架进入载体，各骨架进入载体按以下这种顺序包含：（i)限制酶与其识别位点，和第一连接物序列 (LF) ;(ii)包含可选择标记基因的载体骨架；以及（iii)第二连接物序列（RF)，和限制酶识别位点与其切割序列；以及（iv)任选地，在（i)和（iii)的所述识别位点之间的插入物，任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装。
24. -种用于产生整合在靶位点处的目的核酸构建体的系统，所述系统包含： a. 根据权利要求23所述的系统；以及 b. 至少两个整合序列，其中一个与第一表达盒和靶位点的侧翼序列重组，并且其中第二个与第二表达盒和靶位点另一侧的侧翼序列重组。
【文档编号】C12N15/66GK104204205SQ201380017487
【公开日】2014年12月10日申请日期:2013年3月27日优先权日:2012年3月27日
【发明者】约翰尼斯·安德列什·劳博斯, 赫尔曼·扬·佩尔, 伯纳德·迈瑞克申请人:帝斯曼知识产权资产管理有限公司

文档序号 : 【 467125 】

技术研发人员：约翰尼斯·安德列什·劳博斯,赫尔曼·扬·佩尔,伯纳德·迈瑞克
技术所有人：帝斯曼知识产权资产管理有限公司

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

约翰尼斯·安德列什·劳博斯丨赫尔曼·扬·佩尔丨伯纳德·迈瑞克丨帝斯曼知识产权资产管理有限公司

脂肪酶变体以及编码其的多核苷酸的制作方法用于检测β球蛋白基因的变异的微阵列及其检测方法