CN1597694A

CN1597694A - 脑膜炎奈瑟氏球菌抗原

Info

Publication number: CN1597694A
Application number: CNA2003101220871A
Authority: CN
Inventors: V·马斯格阿尼; R·拉普奥利; M·皮扎; V·斯卡拉托; G·格兰迪
Original assignee: Chrion S P A
Current assignee: Chrion S P A; GSK Vaccines SRL
Priority date: 1998-01-14
Filing date: 1999-01-14
Publication date: 2005-03-23
Also published as: ES2333071T3; US20040126391A1; CN1292820A; DK1047784T3; CY1114333T1; EP2278011A2; JP2009100781A; PT1047784E; WO1999036544A3; DK1047784T4; HK1030435A1; EP1047784B1; EP1047784A2; SG152917A1; JP2002508966A; AU1979599A; US7714121B2; JP4399112B2; ES2333071T5; SG123535A1

Abstract

本发明提供了脑膜炎奈瑟氏球菌(菌株A和B)的蛋白质，包括氨基酸序列、相应的核苷酸序列、表达数据和血清学数据。这些蛋白是用作疫苗、免疫原性组合物和/或诊断剂的有用的抗原。

Description

脑膜炎奈瑟氏球菌抗原

本申请是申请日为1999年1月14日、申请号为CN 99803873.3的中国专利申请的分案申请。

技术领域

本发明涉及脑膜炎奈瑟氏球菌细菌的抗原。

背景技术

脑膜炎奈瑟氏球菌(Neisseria meningitidis)是不能运动的人致病性革兰阴性双球菌。它群集在咽喉处，引起脑膜炎(有时没有脑膜炎而是败血病)。它与淋病奈瑟氏球菌(N.gonorrhoeae)密切相关，然而脑膜炎球菌与淋球菌明显不同的一个特征是所有病原性脑膜炎双球菌中都存在多糖荚膜。

脑膜炎奈瑟氏球菌会引起地方性和流行性疾病。在美国，其发病率为每年每100000人有0.6-1人，爆发时可以高得多(见Lieberman等人，(1996)″血清型A/C脑膜炎奈瑟氏球菌寡糖-蛋白偶联疫苗在幼儿中的安全性和免疫原性″，JAMA 275(19)：1499-1503；Schuchat等人(1997)“1995年美国的细菌性脑膜炎”，N Engl J Med337(14)：970-976)。在发展中国家，地方性疾病发病率要高得多，在流行时，发病率可高达每年每100000人有500起。该病的死亡率在美国很高，为10-20％，在发展中国家则要高得多。在引入了抗流感嗜血菌的偶联物疫苗后，脑膜炎奈瑟氏球菌是引起美国所有年龄人群中细菌性脑膜炎的主要原因(Schuchat等人(1997)同上)。

根据该生物的荚膜多糖，已经鉴定出12种脑膜炎奈瑟氏球菌的血清型。A型是亚撒哈拉-非洲地区流行病中最常见的病原体。B型和C型血清型菌是导致美国以及大多数发达国家内的大多数病例的原因。W135和Y型血清型菌是导致美国和发达国家的其余病例的原因。目前使用的脑膜炎球菌疫苗是由血清型A、C、Y和W135组成的四价多糖疫苗。尽管其在青少年和成人中有效，但是它诱导了差的免疫应答和短期的保护作用，并且不能用于婴儿[例如，见发病率和死亡率每周报道，46卷，PR-5(1997)]。这是因为多糖是T细胞非依赖型抗原，其诱导的弱免疫应答不能通过重复免疫来加强。在流感嗜血杆菌的疫苗接种成功后，已经开发出了针对血清型A和C的偶联疫苗，现在是临床测试的最终阶段(Zollinger WD″新的和改进的抗脑膜炎球菌疾病疫苗″，在：New Generation Vaccines中，同上，469-488页；Lieberman等人(1996)同上；Costantino等人(1992)“抗脑膜炎球菌A和C偶联疫苗的开发和I期临床测试”，Vaccine，10：691-698)。

然而，脑膜炎球菌B仍是一个问题。此血清型目前在美国、欧洲和南美州引起的病例约占总脑膜炎的50％。不能采用多糖方法，因为menB荚膜多糖是α(2-8)-相连的N-乙酰基神经氨酸的聚合物，它也存在于哺乳动物组织中。这导致了对该抗原的耐受；实际上，如果引发免疫应答，则该免疫应答是抗自身的，因此是不希望的。为了避免引起自身免疫力并诱导保护性免疫应答，已经对该荚膜多糖进行化学修饰，例如用N-丙酰基代替N-乙酰基，而不改变特异性抗原性(Romero和Outschoorn(1994)″B型脑膜炎球菌候选疫苗的目前状况：荚膜或非荚膜？″ClinMicrobiol Rev 7(4)：559-575)。

menB疫苗的另一种方法采用外膜蛋白(OMP)的复合物混合物，它只含有OMP、或富集在膜孔蛋白中的OMP，或缺失4型OMP(认为它诱导了封闭杀菌活性的抗体)。该方法产生的疫苗的性质还未经完全分析。它们能保护机体抵抗同源的菌株，但是当有许多外膜蛋白的抗原性变株时一般无效。为了克服抗原性差异，已经构建了含有多达9种不同膜孔蛋白的多价疫苗(例如，Poolman JT(1992)“脑膜炎球菌疫苗的发展”Infect.Agents Dis.4：13-28)。用于外膜疫苗的其它蛋白是opa和opc蛋白，但是这些方法均不能克服抗原性差异(例如Ala′Aldeen和Borriello(1996)″脑膜炎球菌运铁蛋白结合蛋白1和2均是外露的，并产生能杀伤同源和异源菌株的杀菌性抗体″Vaccine14(1)：49-53)。

已可得到脑膜炎球菌和淋球菌基因和蛋白的一定数量的序列信息(例如EP-A-0467714，WO96/29412)，但这决不完全的。提供进一步的序列信息，就有机会能鉴定出估计是免疫系统靶标且没有抗原性差异的分泌的或外露的蛋白。例如，一些已鉴定的蛋白可作为抗脑膜炎球菌B有效疫苗的成分，一些可作为抗有所脑膜炎球菌血清型疫苗的成分，其它可作为抗所有病原性奈瑟氏球菌疫苗的成分。

发明内容

本发明提供了一些蛋白，这些蛋白含有公开在实施例中的脑膜炎奈瑟氏球菌氨基酸序列。

本发明还提供了含有与实施例所公开的脑膜炎奈瑟氏球菌氨基酸序列同源(即具有序列相同性)的序列的蛋白。根据具体的序列，序列相同性的程度宜大于50％(例如60％、70％、80％、90％、95％、99％或更高)。这些同源性蛋白包括实施例中公开的序列的突变体和等位基因变体。通常，认为两种蛋白之间有50％或更高的相同性表明功能等价。蛋白之间的相同性宜用在MPSRCH程序(Oxford Molecular)中执行的Smith-Watemen同源性搜寻算法来确定，采用仿射(affine)空隙搜寻，参数“空隙开口罚分(gap open penalty)”为12，“空隙延伸罚分(gap extension penalty)”为1。

本发明还提供了包含实施例所公开的脑膜炎奈瑟氏球菌氨基酸序列片段的蛋白。该片段应包含该序列中至少n个连续的氨基酸，根据具体的序列，n为7或更高(例如，8、10、12、14、16、18、20或更高)。该片段宜包含该序列的一个表位。

本发明的蛋白当然可用各种方法(例如重组表达、从细胞培养中纯化、化学合成等)制成各种形式(例如天然的、融合物等)。它们宜制成基本上纯的形式(即基本上不含其它脑膜炎奈瑟氏球菌或宿主细胞蛋白)。

另一方面，本发明提供了结合这些蛋白的抗体。它们可能是多克隆的或单克隆的，可用任何合适的方法制得。

还有一方面，本发明提供了包含实施例所公开的脑膜炎奈瑟氏球菌核苷酸序列的核酸。另外，本发明还提供了包含与实施例所公开的脑膜炎奈瑟氏球菌核苷酸序列同源(即具有序列相同性)的序列的核酸。

另外，本发明还提供了能与实施例中公开的脑膜炎奈瑟氏球菌核酸杂交(较佳的是在“高度严谨”条件(例如65℃，在0.1×SSC、0.5％SDS溶液中)下杂交)的核酸。

本发明还提供了包含这些序列之片段的核酸。这些核酸应包含来自脑膜炎奈瑟氏球菌序列的至少n个连续的核苷酸，根据具体的序列，n为10或更高(例如，12、14、15、18、20、25、30、35、40或更高)。

还有一方面，本发明提供了编码本发明的蛋白和蛋白片段的核酸。

也应理解，本发明提供了包含与上述那些序列互补的序列的核酸(例如用于反义或探针目的)。

当然，本发明的核酸可用各种方式(例如化学合成，从基因组或cDNA文库、或从生物体本身制得等)制得，并可采用各种形式(例如单链、双链、载体、探针等)。

另外，术语“核酸”包括DNA和RNA，以及它们的类似物，如含有修饰的骨架的那些，还包括肽核酸(PNA)等。

另一方面，本发明提供了含有本发明的核苷酸序列的载体(如表达载体)以及转化了这些载体的宿主细胞。

另一方面，本发明提供了包含本发明的蛋白、抗体和/核酸的组合物。例如，这些组合物适合用作疫苗，或作为诊断性试剂，或作为免疫原性组合物。

本发明还提供了本发明的核酸、蛋白或抗体用作药剂(例如作为疫苗)或作为诊断性试剂的应用。本发明还提供了本发明的核酸、蛋白或抗体在生产下列物质中的应用：(i)用于治疗或预防奈瑟氏球菌感染的药剂；(ii)用于检测奈瑟氏球菌或针对奈瑟氏球菌产生的抗体是否存在的诊断性试剂；和/或(iii)可产生针对奈瑟氏球菌的抗体的制剂。所述奈瑟氏球菌可以是任何种或菌株(例如淋病奈瑟氏球菌)，但较佳的是脑膜炎奈瑟氏球菌，尤其是菌株A、菌株B或菌株C。

本发明还提供了一种治疗患者的方法，该方法包括给予患者治疗有效量的本发明的核酸、蛋白和/或抗体。

还有一方面，本发明提供了以下各种方法。

本发明提供了一种生产本发明蛋白的方法，该方法包括在诱导蛋白表达的条件下培育本发明的宿主细胞的步骤。

本发明提供了一种生产本发明的蛋白或核酸的方法，其中用化学手段合成部分或全部的蛋白或核酸。

本发明提供了一种检测本发明的多核苷酸的方法，该方法包括下列步骤：(a)在杂交条件下使本发明的核酸探针与生物样品接触，形成双链体；和(b)检测所述双链体。

本发明提供了一种检测本发明的蛋白质的方法，该方法包括下列步骤：(a)在适合形成抗体-抗原复合物的条件下使本发明的抗体和生物样品接触；和(b)检测所述复合物。

与PCT/IB98/01665中公开的序列不同，认为本申请中公开的序列在淋病奈瑟氏球菌中没有任何明显的同源性。因此，本发明的序列还可用来制备区分脑膜炎奈瑟氏球菌和淋病奈瑟氏球菌的制剂。

下面归纳了为了实施本发明而采用的标准技术和方法(例如用公开的序列接种或诊断性目的)。这种归纳不是对本发明的限制，而是举例，这些例子可以采用，但是不要求一定用。

总论

除非另有描述，本发明的实施将采用分子生物学、微生物学、重组DNA和免疫学的常规技术，这些均是本领域技术人员所知的。这些技术在下列文献中有完整的描述：例如，Sambrook《分子克隆实验手册》第2版(1989)；《DNA克隆》第I和II卷(D.N.Glover编辑1985)；《寡核苷酸合成》(M.J.Gait编辑，1984)；《核酸杂交》(B.D.Hames和S.J.Higgins编辑.1984)；《转录和翻译》(B.D.Hames和S.J.Higgins编辑，1984)；《动物细胞培养》(R.I.Freshney编辑，1986)；《固定化细胞和酶》(IRL出版社，1986)；B.Perbal，《分子克隆实用指南》(1984)；《酶学方法》系列丛书(Academic Press，Inc.)，尤其是154和155卷；《哺乳动物细胞用的基因转移载体》(J.H.Miller和M.P.Calos编辑，1987，Cold Spring Harbor Laboratory)；Mayer和Walker编辑(1987)，《细胞和分子生物学的免疫化学方法》(Academic Press，London)；Scopes，(1987)《蛋白质纯化：原理和实践》第2版(Springer-Verlag，N.Y.)，以及《实验免疫学手册》I-IV卷(D.M.Weir和C.C.Blackwell编辑1986)。

在本说明书中采用了核苷酸和氨基酸的标准缩写。

本文引用的所有出版物、专利和专利申请均纳入本文作参考。尤其是将英国专利申请9800760.2、9819015.0和9822143.5的内容纳入本文作为参考。

定义

当组合物中总X+Y重量的至少85％是X时，则称含有X的组合物“基本上没有Y”。较佳的，X占组合物中X+Y总重量的至少约90％，更佳至少约95％或者甚至99％(重量)。

术语“包含”指“包括”以及“由…组成”，例如组合物“包含”X可以是只由X组成，或可包括X以外的物质，例如X+Y。

术语“异源”指在自然界中发现不在一起的两种生物学组分。此组分可以是宿主细胞、基因、或调控区如启动子。尽管异源组分在自然界中发现不在一起，但是它们能一起起作用，例如当与基因异源的启动子与该基因操作性相连时。另一个例子是奈瑟氏球菌序列与小鼠宿主细胞异源。还有一个例子是相同或不同蛋白的两个表位以自然界中未曾发现的排列方式装配到一个蛋白中。

“复制起点”是启动和调节多核苷酸(例如表达载体)复制的多核苷酸序列。复制起点可作为细胞内多核苷酸复制的自主性单位，能在其自身的控制下进行复制。复制起点是载体在特定宿主细胞中复制所需的。有了某一复制起点，表达载体就能在细胞中合适蛋白的存在下高拷贝数的复制。复制起点的例子是在酵母中有效的自主复制序列；以及在COS-7细胞中有效的病毒性T-抗原。

“突变体”序列定义成与天然或公开的序列不同但具有序列相同性的DNA、RNA或氨基酸序列。根据具体的序列，天然或公开的序列与突变体序列之间的序列相同性程度宜大于50％(例如60％、70％、80％、90％、95％、99％或更高，用上述Smith-Waterman算法计算出)。如本文所述，本文提供的核酸序列的核酸分子或区域的“等位基因变体”是在另一或第二个分离物基因组中基本相同的基因座上的核酸分子或区域，由于诸如突变或重组引起的自然变异，它们具有相似但不相同的核酸序列。编码区等位基因变体通常编码的蛋白具有与其比较的基因所编码蛋白相似的活性。等位基因变体还可包含基因5′或3′非翻译区中的变化，例如在调控控制区中的变化(例如见美国专利5,753,235)。

表达系统

奈瑟氏球菌核苷酸序列可在各种不同的表达系统中表达；例如和哺乳动物细胞、杆状病毒、植物、细菌和酵母一起使用的那些系统。

i.哺乳动物系统

哺乳动物表达系统是本领域中已知的。哺乳动物启动子是能结合哺乳动物RNA聚合酶并启动下游(3′)编码序列(如结构基因)转录成mRNA的任何DNA序列。启动子具有一个转录起始区，其通常邻近编码序列的5′端，还具有一个TATA盒，其通常位于转录起始位点上游25-30个碱基对(bp)处。认为TATA盒指导RNA聚合酶II在正确位点开始RNA合成。哺乳动物启动子还含有一个上游启动子元件，其通常位于TATA盒上游100至200bp内。该上游启动子元件决定了转录启动的速度，并可在两个方向之一上起作用[Sambrook等人(1989)“克隆基因在哺乳动物细胞中的表达”《分子克隆实验手册》，第2版]。

哺乳动物病毒基因通常是高表达的，具有宽的宿主范围；因此，编码哺乳动物病毒基因的序列提供了特别有用的启动子序列。例子包括SV40早期启动子、小鼠乳房肿瘤病毒LTR启动子、腺病毒主要晚期启动子(Ad MLP)以及单纯疱疹病毒启动子。另外，从非病毒基因(如小鼠金属硫蛋白基因)衍生的序列也提供了有用的启动子序列。表达可以是组成型的或受调控的(诱导的)，这取决于该启动子能否在激素反应性细胞中用促糖皮质激素诱导。

增强元件(增强子)的存在，联合上述启动子元件通常会提高表达水平。增强子是这样一种调控性DNA序列，当其与同源或异源启动子相连，合成在正常的RNA起始位点开始时，它能刺激转录提高1000倍。当增强子位于转录起始位点的上游或下游，处于正常或翻转方向，或距离启动子1000个核苷酸以上的距离时，它均具有活性[Maniatis等人(1987)Science 236：1237；Alberts等人(1989)《细胞分子生物学》，第2版]。从病毒衍生获得的增强子元件可能是特别有用的，因为它们通常具有较宽的宿主范围。例子包括SV40早期基因增强子[Dijkema等人(1985)EMBO J.4：761]以及衍生自Rous肉瘤病毒的长末端重复序列(LTR)的增强子/启动子[Gorman等人(1982b)Proc.Natl.Acad.Sci.79：6777]以及来自人巨细胞病毒的增强子/启动子[Boshart等人(1985)Cell 41：521]。另外，一些增强子仅仅在诱导物(例如激素或金属离子)的存在下是可调节的并变成具有活性[Sassone-Corsi和Borelli(1986)Trends Genet.2：215；Maniatis等人(1987)Science 236：1237]。

DNA分子可在哺乳动物细胞中胞内表达。启动子序列可以和DNA分子直接相连，在这种情况下，重组蛋白的N端第一个氨基酸始终是甲硫氨酸，其由ATG起始密码子编码。如果需要，可通过和溴化氰体外培育来从蛋白上切下该N端。

另外，外来蛋白也可从细胞中分泌到生长培养基中，方法是产生嵌合的DNA分子，该DNA分子编码的融合蛋白包括一前导序列片段，该片段在哺乳动物细胞中提供了外源蛋白的分泌。较佳的，在前导序列片段和外源基因之间可以有能在体内或体外断裂的加工位点。前导序列片段通常编码一种信号肽，该信号肽由指导蛋白分泌出细胞的疏水性氨基酸组成。腺病毒三联前导序列是在哺乳动物细胞中提供分泌外来蛋白的一个前导序列例子。

通常，哺乳动物细胞识别的转录终止和聚腺苷酸化序列是位于翻译终止密码子3′的调控区域，因此它和启动子元件一起连接在编码序列的侧面。成熟mRNA的3′端由定点的转录后断裂和聚腺苷酸化形成[Bimstiel等人(1985)Cell 41：349；Proudfoot和Whitelaw(1988)″真核RNA的终止和3′端加工″《转录和剪接》(B.D.Hames和D.M.Glover编辑)；Proudfoot(1989)Trends Biochem.Sci.14：105]。这些序列指导mRNA的转录，mRNA能被翻译成该DNA编码的多肽。转录终止子/聚腺苷酸化信号的例子包括从SV40衍生获得的那些[Sambrook等人(1989)“克隆基因在培养的哺乳动物细胞中的表达”《分子克隆实验手册》]。

通常，上述组件，包括启动子、聚腺苷酸化信号以及转录终止序列被一起放在表达构建物中。如果需要，该表达构建物中还包括增强子、具有功能性剪接供体和受体位点的内含子以及前导序列。表达构建物通常以复制子形式维持，例如是能在宿主(如哺乳动物细胞或细菌)中稳定维持的染色体外元件(如质粒)。哺乳动物复制系统包括从动物病毒衍生的那些系统，其需要反式作用因子来进行复制。例如，含有乳多空病毒复制系统的质粒，如SV40[Gluzman(1981)Cell 23：175]或多瘤病毒，在合适的病毒T抗原存在下复制出极高的拷贝数。哺乳动物复制子的其它例子包括衍生自牛乳头瘤病毒和EB病毒的复制子。另外，复制子可以有两个复制系统，从而使其能维持在例如哺乳动物细胞中进行表达并能在原核宿主中克隆和扩增。这些哺乳动物细菌穿梭载体的例子包括pMT2[Kaufman等人(1989)Mol.Cell.Biol.9：946]和pHEBO[Shimizu等人(1986)Mol.Cell.Biol.6：1074]。

所用的转化程序取决于待转化的宿主。将异源多核苷酸导入哺乳动物细胞中的方法是本领域所知的，包括葡聚糖介导的转染、磷酸钙沉淀、Polybrene(1，5-二甲基-1，5-二氮十一亚甲基聚甲溴化物)介导的转染、原生质体融合、电穿孔、将多核苷酸包裹在脂质体中以及将DNA直接显微注射到胞核中。

可作为宿主进行表达的哺乳动物细胞系是本领域中已知的，包括许多从美国典型培养物保藏中心(ATCC)获得的无限增殖细胞系，包括但不局限于，中国仓鼠卵巢(CHO)细胞、海拉细胞、幼仓鼠肾(BHK)细胞、猴肾细胞(COS)、人肝细胞癌细胞(如Hep G2)和其它许多细胞系。

ii.杆状病毒系统

编码蛋白质的多核苷酸也可插入合适的昆虫表达载体中，并与该载体中的控制元件操作性相连。载体构建采用本领域已知的技术。总地来说，表达系统的组分包括一个转移载体，通常是细菌质粒，其含有杆状病毒基因组片段以及便于插入待表达异源基因的限制性位点；野生型杆状病毒，其序列与转移载体中的杆状病毒特异性片段同源(这使得异源基因能同源重组到杆状病毒基因组中)；以及合适的昆虫宿主细胞和生长培养基。

在将编码蛋白质的DNA序列插入转移载体中后，将载体和野生型病毒基因组转染到昆虫宿主细胞中，使载体和病毒基因组重组。表达包装的重组病毒，鉴定并纯化重组噬斑。用于杆状病毒/昆虫细胞表达系统的材料及其方法，除别的以外，可以试剂盒形式购自Invitrogen，San Diego CA(″MaxBac″试剂盒)。这些技术通常是本领域技术人员所知的，在Summers和Smith的Texas Agricultural Experiment Station Bulletin No.1555(1987)(后称“Summer和Smith的文章”)中有充分描述。

在将编码蛋白质的DNA序列插入杆状病毒基因组之前，通常将上述组件，包括启动子、前导序列(如果需要)、感兴趣的编码序列以及转录终止序列装配在中间置换型构建物(转移载体)中。该构建物可含有单个基因以及操作性相连的调控元件；多个基因，每个基因有其自己的操作性相连调控元件；或是由同一组调控元件调控的多个基因。中间置换型构建物通常保持在一个复制子中，例如能在宿主(如细菌)内稳定保持的染色体外元件(如质粒)。复制子将具有一个复制系统，从而使其能保持在合适的宿主中进行克隆和扩增。

目前，用来将外源基因导入AcNPV的最常用的转移载体是pAc373。还可设计本领域技术人员已知的其它许多载体。这些载体例如包括，pVL985(其将多角体蛋白的起始密码子从ATG变为ATT，在ATT下游32个碱基对处引入一个BamHI克隆位点；见Luckow和Summers，Virology(1989)17：31。

质粒通常还含有多角体蛋白聚腺苷酸化信号(Miller等人(1988)Ann.Rev.Microbiol.，42：177)以及用来在大肠杆菌中选择和繁殖的原核氨苄青霉素抗性(amp)基因和复制起点。

杆状病毒转移载体通常含有杆状病毒启动子。杆状病毒启动子是能结合杆状病毒RNA聚合酶并启动下游(5′到3′)编码序列(如结构基因)转录成mRNA的DNA序列。启动子具有一个转录起始区，该区通常邻近编码序列的5′端。该转录起始区通常包括一个RNA聚合酶结合位点以及一个转录起始位点。杆状病毒转移载体还可能有称为增强子的第二个区，如果该区域存在，它通常在结构基因的远端。表达可以是调控的或组成型的。

在病毒感染周期晚期大量转录的结构基因提供特别有用的启动子序列。例子包括从编码病毒多角体蛋白的基因衍生获得的序列，Friesen等人(1986)“杆状病毒基因表达的调控”《杆状病毒分子生物学》(Walter Doerfler编辑)；EPO公开号127 839和155476；以及编码p10蛋白的基因，Vlak等人(1988)，J.Gen.Virol.69：765。

编码合适的信号序列的DNA可以衍生自分泌的昆虫或杆状病毒蛋白的基因(如杆状病毒多角体蛋白基因)(Carbonell等人，(1988)Gene，73：409)。另外，由于哺乳动物细胞翻译后修饰(如信号肽断裂、蛋白水解断裂和磷酸化)的信号看来可被昆虫细胞识别，且分泌和胞核积累所需的信号看来在非脊椎动物细胞和脊椎动物细胞之间是保守的，因此也可用非昆虫来源的前导序列来提供昆虫中的分泌，这些前导序列例如是从编码人α-干扰素(Maeda等人(1985)，Nature 315：592)、人胃泌素释放肽(Lebacq-Verheyden等人(1988)，Molec.Cell.Biol.8：3129)、人IL-2(Smith等人(1985)PNAS，82：8404)、小鼠IL-3(Miyajima等人(1987)Gene 58：273)和人葡糖脑苷脂酶(Martin等人(1988)DNA，7：99)的基因衍生获得的。

重组多肽或聚蛋白可以在胞内表达，或如果它和合适的调控序列一起表达，它可被分泌。非融合的外源蛋白的良好的胞内表达通常要求具有短前导序列的异源基因在ATG起始信号前含有合适的翻译起始信号。如果需要，可通过和溴化氰体外培育来从成熟蛋白上切下N端甲硫氨酸。

另外，可通过产生嵌合的DNA分子将非天然分泌的重组聚蛋白或蛋白从昆虫细胞中分泌出来，该嵌合的DNA分子所编码的融合蛋白包含一前导序列片段，该片段提供了外源蛋白在昆虫中的分泌作用。该前导序列片段通常编码一种信号肽，该信号肽包含的疏水性氨基酸指导蛋白质转移到内质网中。

在插入了编码该蛋白表达产物前体的DNA序列和/或基因后，用转移载体的异源DNA和野生型杆状病毒的基因组DNA共同转化(通常是共转染)昆虫细胞宿主。构建物的启动子和转录终止序列通常包含2-5kb的杆状病毒基因组片段。将异源DNA引入杆状病毒中所需位点内的方法是本领域所知的。(见Summers和Smith的文章，同上；Ju等人(1987)；Smith等人，Mol.Cell.Biol.(1983)3：2156；和Luckow和Summers(1989))。例如，插入可以是通过同源双交换重组来插入基因如多角体蛋白基因中；插入还可以是插入工程改造入所需杆状病毒基因内的限制性酶切位点中。Miller等人(1989)，Bioessays 4：91。当DNA序列被克隆在表达载体多角体蛋白基因位置中时，其5′和3′均侧接了多角体蛋白特异性序列，并位于多角体蛋白启动子的下游。

随后将新形成的杆状病毒表达载体包装到感染性重组杆状病毒中。发生同源重组的频率很低(在约1％和5％之间)；因此，共转染后产生的大多数病毒仍是野生型病毒。故需要一种方法来鉴别重组病毒。该表达系统的一个优点是目视筛选能区分重组病毒。在病毒感染后期，天然病毒产生的多角体蛋白在受感染细胞胞核中水平非常高。累积的多角体蛋白形成的包涵体还含有包埋颗粒。这些包涵体的大小高达15微米，它们具有高度的折光性，从而使它们呈现明亮发光的外观，在光学显微镜下很容易观察到。感染了重组病毒的细胞缺少包涵体。为了区分重组病毒和野生型病毒，用本领域已知的技术将转染上清接种到单层昆虫细胞上形成噬斑。即，在光学显微镜下筛选存在(表明是野生型病毒)或不存在(表明是重组病毒)包涵体的噬斑。“当代微生物学方法”第2卷(Ausubel等人编辑)，16.8(增补10，1990)；Summers和Smith，同上；Miller等人(1989)。

已经开发出能感染进入几种昆虫细胞的重组杆状病毒表达载体。例如，已经开发出用于感染以下昆虫细胞的重组杆状病毒：埃及伊蚊、苜蓿丫纹夜蛾、家蚕、黑尾果蝇、草地夜蛾和粉纹夜蛾(WO 89/046699；Carbonell等人(1985)J.Virol.56：153；Wright(1986)Nature 321：718；Smith等人(1983)Mol.Cell.Biol.3：2156；综述见Fraser等人(1989)Vitro Cell.Dev.Biol.25：225)。

可以购得细胞和细胞培养基用于在杆状病毒/表达系统中直接表达和融合表达异源多肽；细胞培养技术是本领域技术人员通常所知的。例如见Summers和Smith，同上。

然后，经修饰的昆虫细胞可以生长在合适的营养培养基中，该培养基能稳定地保持质粒存在于修饰的昆虫宿主中。当表达产物基因处于可诱导的控制下时，可以使宿主生长至高密度，并诱导表达。另外，当表达是组成型表达时，产物将被连续表达进入培养基中，营养性培养基必需不断循环，同时取出感兴趣的产物并补充消耗的营养物。产物可用以下技术来纯化：例如层析，如HPLC、亲和层析、离子交换层析等；电泳；密度梯度离心；溶剂抽提等。产物可按需作进一步纯化，以基本上除去所有也分泌到培养基中或由昆虫细胞裂解而产生的昆虫蛋白，以提供一种至少基本上不含宿主碎片(如蛋白质、脂质和多糖)的产物。

为了获得蛋白质表达，将从转化子衍生获得的重组宿主细胞培育在允许重组蛋白编码序列表达的条件下。这些条件将随所选定的宿主细胞而变。然而，本领域技术人员容易根据本领域已知的知识来确定该条件。

iii.植物系统

本领域中已知有许多植物细胞培养系统和全植物基因表达系统。典型的植物细胞基因表达系统包括在以下专利中描述的那些，例如：US 5,693,506；US 5,659,122；和US5,608,143。Zenk，Phytochemistry 30：3861-3863(1991)中描述了在植物细胞培养物中遗传表达的其它例子。除上述参考文献外，关于植物蛋白信号肽的描述还可在下列文献中找到：Vaulcombe等人，Mol.Gen.Genet.209：33-40(1987)；Chandler等人，PlantMolecular Biology 3：407-418(1984)；Rogers，J.Biol.Chem.260：3731-3738(1985)；Rothstein等人，Gene 55：353-356(1987)；Whittier等人，Nucleic Acids Research15：2515-2535(1987)；Wirsel等人，Molecular Microbiology 3：3-14(1989)；Yu等人，Gene 122：247-253(1992)。关于用植物激素、赤霉素酸和赤霉素酸诱导分泌的酶调节植物基因表达的描述可在R.L.Jones和J.MacMillin，Gibberellins，《植物生理学进展》，Malcolm B.Wilkins编辑，1984 Pitman Publishing Limited，London，21-52页中找到。描述其它调节代谢的基因的参考文献参见：Sheen，Plant Cell，2：1027-1038(1990)；Maas等人，EMBO J.9：3447-3452(1990)；Benkel和Hickey，Proc.Natl.Acad.Sci.84：1337-1339(1987)。

通常，利用本领域已知的技术，将所需的多核苷酸序列插入一表达盒中，该表达盒含有为在植物中操作而设计的基因调控元件。将该表达盒插入所需的表达载体中，表达盒的上游和下游有适合在植物宿主中表达的伴随序列。这些伴随序列可来自质粒或病毒，并为载体提供所需的性质，以允许载体将DNA从起初的克隆宿主(如细菌)中移动到所需植物宿主中。基础的细菌/植物载体构建物最好能提供宽的宿主范围原核复制起点；原核可选择标记；以及，对于农杆菌转化而言，宜提供T DNA序列用于农杆菌介导转移至植物染色体。当异源基因不易检测时，该构建物最好还具有一个适用于确定植物细胞是否已被转化的可选择标记基因。关于合适标记(例如对于禾草类家族成员)的综述可在Wilmink和Dons，1993，PlantMol.Biol.Reptr，11(2)：165-185中找到。

还建议采用适合将异源序列整合到植物基因组中的序列。这些序列可能包括用于同源重组的转座子序列以及允许将异源表达盒随机插入植物基因组中的Ti序列。合适的原核可选择标记包括抗生素(如氨苄青霉素或四环素)抗性标记。编码其它功能的其它DNA序列也可存在于载体中，这是本领域所知的。

本发明的核酸分子可包括在一个表达盒中来表达感兴趣的蛋白质。通常只有一个表达盒，但是两个或多个表达盒也是可行的。除了编码异源蛋白的序列外，重组表达盒还含有下列元件：启动子区域、植物5′非翻译序列、起始密码子(根据结构基因原来是否具有而定)、以及转录和翻译终止序列。表达盒5′和3′端的独特限制性酶位点能使表达盒方便地插入预先存在的载体中。

异源编码序列可以是任何与本发明有关的蛋白的编码序列。编码感兴趣的蛋白的序列将编码出一个信号肽，该信号肽能适当地加工和转运蛋白质，并且通常缺少可能会导致本发明的所需蛋白与膜结合的序列。由于对于大部分来说，转录起始区将是发芽期间被表达和转运的基因的转录起始区，通过采用提供转运的信号肽，也可提供对感兴趣蛋白质的转运。通过这种方式，感兴趣的蛋白将从表达该蛋白的细胞中转运出来，并能被有效地收获。通常，种子中的分泌是通过糊粉或小盾体上皮层进入种子的胚乳。尽管不需要使蛋白从产生该蛋白的细胞中分泌出来，但是这种分泌有利于重组蛋白的分离和纯化。

由于所需基因产物的最终表达将在真核细胞中进行，因此需要确定克隆的基因部分是否含有作为内含子被宿主剪接体机制加工的序列。如果是这样，需要对“内含子”区进行定点诱变，以防止一部分遗传信息作为错误的内含子密码而丧失，Reed和Maniatis，Cell 41：95-105，1985。

可用微量移液管以机械方式转移重组DNA，将载体直接显微注射到植物细胞中。Crossway，Mol.Gen.Genet，202：179-185。还可用聚乙二醇将遗传物质转移到植物细胞中，Kens等人，Nature，296，72-74，1982。导入核酸片段的另一种方法是用小颗粒进行高速弹道贯穿，在这些小珠或颗粒的基质中或表面上带有核酸，Klein等人，Nature，327，70-73，1987，Knudsen和Muller，1991，Planta，185：330-336提出用颗粒轰击大麦胚乳以产生转基因大麦。还有一种导入方法是使原生质体和其它实体(微细胞(minicell)、细胞、溶酶体或其它可融合的脂质表面体)融合，Fraley等人，Proc.Natl.Acad.Sci.USA，79，1859-1863，1982。

载体也可通过电穿孔导入植物细胞中。(Fromm等人，PNAS 82：5824，1958)。在该技术中，在含有基因构建物的质粒存在下对植物原生质体进行电穿孔。高电场强度的电脉冲使生物膜可逆地被通透，从而允许导入质粒。电穿孔的植物原生质体改造了细胞壁，分裂并形成植物胼胝体。

本发明可转化所有的植物，从中能分离出原生质体并能培育产生全再生植株，从而回收得到含有转基因的全植株。已经知道实际上所有植物均可以从培育的细胞或组织再生，它们包括但不局限于，甘蔗、甜菜、棉花、果实和其它树、豆科植物和蔬菜的所有主要种类。一些合适的植物包括，例如，草莓属、莲花属、苜蓿属、驴食豆属、三叶草属、胡卢巴属、豇豆属、柑橘属、亚麻属、老鹳草属、Manihot、Daucus、鼠耳芥属、芸苔属、萝卜属、白芥属、颠茄属、辣椒属、曼陀罗属、天仙子属、番茄属、烟草属、茄属、碧冬茄属、毛地黄属、Majorana、菊苣属、向日葵属、莴苣属、雀麦属、天门冬属、金鱼草属、龙骨角属、Nemesia、天竺葵属、稷属、狼尾草属、毛茛属、千里光属、Salpiglossis、香瓜属、Browaalia、大豆属、黑麦草属、玉蜀黍属、小麦、蜀黍属和曼陀罗属各种类。

各种植物的再生方式是不同的，但通常是首先提供含有异源基因拷贝的转化的原生质体悬液。形成胼胝体组织，从胼胝体中诱生出枝条，随后是根。另外，从原生质体悬液可以诱生形成胚胎。这些胚胎象天然的胚胎那样发芽形成植物。培养基通常含有各种氨基酸和激素，如植物生长素和细胞分裂素。尤其是对于玉米和苜蓿属来说，在培养基中加入谷氨酸和脯氨酸也是很有利的。枝条和根通常同时发育。有效的再生取决于培养基、基因型以及培养史。如果控制了这三个变量，那么再生能完全再现和重复。

在一些植物细胞培养系统中，本发明所需的蛋白可能被排泄出来，或者蛋白可从全植物中提取出来。当本发明所需的蛋白被分泌到培养基中后，就可进行收集。或者，可以用机械方式破碎胚以及无胚-半种子或其它植物组织，以释放出分泌到细胞和组织之间的蛋白。将该混合物悬于缓冲液中，以提取可溶性蛋白。然后用常规的蛋白分离和纯化方法纯化重组蛋白。用常规方法调节时间、温度、pH、氧和体积等参数，以优化异源蛋白的表达和回收。

iv.细菌系统

细菌表达技术是本领域已知的。细菌启动子是能结合细菌RNA聚合酶并启动下游(3′)编码序列(如结构基因)转录成mRNA的DNA序列。启动子具有一个转录起始区，其通常位于编码序列的5′端附近。该转录起始区通常包括一个RNA聚合酶结合位点以及一个转录起始位点。细菌启动子可能还有第二个功能区域称为操纵子，它可能与毗邻的RNA合成开始的RNA聚合酶结合位点重叠。该操纵子允许(可诱导)对转录的负调节，因为基因阻遏蛋白可能结合操纵子并因而抑制特定基因的转录。在负调节元件(如操纵子)不存在时，可能发生组成型表达。另外，正调节可通过基因激活蛋白结合序列来实现，如果有的话，它通常邻近RNA聚合酶结合序列(5′)。基因激活蛋白的例子是分解代谢物激活剂蛋白(CAP)，它帮助启动大肠杆菌(E.coli)中的lac操纵子的转录[Raibaud等人(1984)Annu.Rev.Genet.18：173]。因此，表达调控可能是正作用或负作用，从而增强或减弱了转录。

编码代谢途径中的酶的序列提供了特别有用的启动子序列。例子包括衍生自糖(如半乳糖、乳糖(lac)[Chang等人(1977)Nature 198：1056]和麦芽糖)代谢酶的启动子序列。其它例子包括衍生自生物合成酶(如色氨酸(trp))[Goeddel等人(1980)Nuc.AcidsRes.8：4057；Yelverton等人(1981)Nucl.Acids Res.9：731；美国专利4,738,921；EP-A-0036776和EP-A-0121775]的启动子序列。g-内酰胺酶(bla)启动子系统[Weissmann(1981)″干扰素的克隆和其它错误″《干扰素3》(I.Gresser编辑)]，λ嗜菌体PL[Shimatake等人(1981)Nature 292：128]和T5[美国专利4,689,406]启动子系统也提供了有用的启动子序列。

另外，非天然存在的合成的启动子也可象细菌启动子一样起作用。例如，一种细菌或嗜菌体启动子的转录激活序列可以和另一种细菌或嗜菌体启动子的操纵子序列连接在一起，形成合成的杂合启动子[美国专利4,551,433]。例如，tac启动子是杂合的trp-lac启动子，它由trp启动子以及受lac阻遏蛋白调节的lac操纵子序列组成[Amann等人(1983)Gene 25：167；de Boer等人，(1983)Proc.Natl.Acad.Sci.80：21]。另外，细菌启动子可包括非细菌来源但能结合细菌RNA聚合酶并启动转录的天然存在的启动子。天然存在的非细菌来源的启动子还能和相容的RNA聚合酶偶联在一起，从而在原核细胞中高水平地表达某些基因。噬菌体T7 RNA聚合酶/启动子系统是偶联的启动子系统的一个例子[Studier等人(1986)J.Mol.Biol.189：113；Tabor等人(1985)Proc.Natl.Acad.Sci.82：1074]。另外，杂合的启动子还可由嗜菌体启动子以及大肠杆菌操纵子区域组成(EPO A-0 267 851)。

除了有功能的启动子序列外，有效的核糖体结合位点对于外来基因在原核细胞中的表达也是有用的。在大肠杆菌中，核糖体结合位点称为Shine-Dalgamo(SD)序列，其包括起始密码子(ATG)以及在起始密码子上游3-11个核苷酸处的长度为3-9个核苷酸的序列[Shine等人(1975)Nature 254：34]。认为SD序列是通过SD序列和大肠杆菌16S rRNA的3′端碱基配对来促进mRNA与核糖体结合的[Steitz等人(1979)″信使RNA中的遗传信号和核苷酸序列″《生物学调节和发育：基因表达》(编者R.F.Goldberger)]。为了表达具有弱的核糖体结合位点的原核基因和真核基因[Sambrook等人(1989)″克隆基因在大肠杆菌中的表达″《分子克隆实验手册》]。

DNA分子可以在胞内表达。启动子序列可以直接与DNA分子相连，在这种情况下，N端的第一个氨基酸始终是甲硫氨酸，其由ATG起始密码子编码。如果需要，可通过和溴化氰体外培育或通过和细菌甲硫氨酸N-端肽酶体内或体外培育，将N端的甲硫氨酸从蛋白质上切下(EPO-A-0 219 237)。

融合蛋白为直接表达提供了一种备选方案。通常，将编码内源细菌蛋白或其它稳定的蛋白之N端部分的DNA序列与异源编码序列的5′端融合。在表达时，该构建物将提供这两个氨基酸序列的融合物。例如，λ噬菌体细胞基因可以和外源基因的5′端相连并在细菌中表达。所得融合蛋白宜保留一个酶(因子Xa)加工位点，以便将噬菌体蛋白与外源基因切开[Nagai等人(1984)Nature 309：810]。融合蛋白也可用lacZ[Jia等人(1987)Gene 60：197]，trpE[Allen等人(1987)J.Biotechnol.5：93；Makoff等人(1989)，J.Gen.Microbiol.135：11]以及Chey[EP-A-0-324 647]基因的序列组成。两个氨基酸序列连接处的DNA序列可能编码或不编码可切割的位点。另一个例子是遍在蛋白融合蛋白。这种融合蛋白由遍在蛋白区域组成，该区域宜保留一个酶(例如遍在蛋白特异性加工蛋白酶)加工位点，以便将外源蛋白和遍在蛋白切开。通过这种方法，可以分离获得天然的外源蛋白[Miller等人(1989)Bio/Technology 7：698]。

另外，还可通过产生嵌合的DNA分子来将外源蛋白分泌出细胞，该嵌合的DNA分子编码的融合蛋白含有一个信号肽序列片段，该序列片段能使细菌中的外源蛋白分泌出来[美国专利4,336,336]。信号序列片段通常编码一个信号肽，该信号肽含有疏水性氨基酸，能指导蛋白分泌出细胞。蛋白质被分泌到生长培养基(革兰阳性菌)中或细胞内膜和外膜之间的周质间隙内(革兰阴性菌)。在编码的信号肽片段和外源基因之间宜具有能在体内或体外切割的加工位点。

编码合适信号序列的DNA可以从分泌性细菌蛋白的基因衍生获得，这些基因例如是大肠杆菌外膜蛋白基因(ompA)[Masui等人(1983)，《基因表达的实验操作》；Ghrayeb等人(1984)EMBO J.3：2437]以及大肠杆菌碱性磷酸酶信号序列(phoA)[Oka等人(1985)Proc.Natl.Acad.Sci.82：7212]。另一个例子是，可采用各种芽孢杆菌菌株的α淀粉酶基因的信号序列将异源蛋白分泌出枯草芽孢杆菌[Palva等人(1982)Proc.Natl.Acad.Sci.USA 79：5582；EP-A-0 244 042]。

通常，细菌所识别的转录终止序列是位于翻译终止密码子3′的调控区，它和启动子一起侧接在编码序列的两侧。这些序列指导mRNA的转录，而mRNA能被翻译成该DNA所编码的多肽。转录终止序列通常包括约50个核苷酸的DNA序列，该序列能形成帮助终止转录的茎环结构。例子包括衍生自具有强启动子的基因(如大肠杆菌中的trp基因以及其它生物合成的基因)的转录终止序列。

上述组件，包括启动子、信号序列(如果需要)、感兴趣的编码序列以及转录终止序列通常被一起放在表达构建物中。表达构建物通常以复制子的形式维持，例如能在宿主(如细菌)中稳定维持的染色体外元件(如质粒)。复制子具有一个复制系统，从而允许其维持在原核宿主中或进行表达或进行克隆和扩增。另外，复制子可以是高拷贝数或低拷贝数的质粒。高拷贝数质粒的拷贝数大致在约5至200之间，通常在约10至150之间。含有高拷贝数质粒的宿主宜含有至少约10个质粒，更佳的含有至少约20个质粒。根据载体以及外源蛋白对宿主的影响，可以选择高拷贝数或低拷贝数的载体。

另外，表达构建物可以和一个整合载体一起整合入细菌基因组中。整合载体通常含有至少一个与细菌染色体同源的序列，从而允许该载体整合。整合看来是载体和细菌染色体中的同源DNA之间重组引起的。例如，用不同芽孢杆菌菌株的DNA构建的整合载体整合到芽孢杆菌染色体中(EP-A-0 127 328)。整合载体还可包含噬菌体或转座子序列。

通常，染色体外的以及整合的表达构建物均含有可选择的标记，以便选择已经转化的菌株。可选择的标记可在细菌宿主中表达，其包括赋予细菌对药物(如氨苄青霉素、氯霉素、红霉素、卡那霉素(新霉素)和四环素)抗性的基因[Davies等人(1978)Annu.Rev.Microbiol.32：469]。可选择标记还可包括生物合成性基因，如在组氨酸、色氨酸以及亮氨酸生物合成途径中的那些基因。

另外，上述某些组件可以一起放在转化载体中。转化载体通常包含一个可选择标记，如上所述，该载体以复制子形式维持或发展成一个整合载体。

已经开发出了用于转化到许多细菌中的表达和转化载体(无论是染色体外复制子还是整合载体)。例如，已经开发出了用于下列细菌的表达载体：枯草芽孢杆菌[Palva等人，(1982)Proc.Natl.Acad.Sci.USA 79：5582；EP-A-0 036 259和EP-A-0 063 953；WO 84/04541]，大肠杆菌[Shimatake等人，(1981)Nature 292：128；Amann等人，(1985)Gene 40：183；Studier等人，(1986)J.Mol.Biol.189：113；EP-A-0 036 776，EP-A-0 136829和EP-A-0 136 907]，酪链球菌[Powell等人，(1988)Appl.Environ.Microbiol.54：655]；浅青紫链球菌[Powell等人，(1988)Appl.Environ.Mierobiol.54：655]，浅青紫链霉菌[US patent 4,745,056].

将外源DNA导入细菌宿主的方法是本领域熟知的，通常包括用氯化钙或其它试剂(如二价阳离子和DMSO)处理对细菌进行转化。DNA还可通过电穿孔方法导入细菌细胞。转化程序通常因待转化的细菌种类而异。例如参见[Masson等人，(1989)FEMSMicrobiol.Lett.60：273；Palva等人，(1982)Proc.Natl.Acad.Sci.USA 79：5582；EP-A-0036 259和EP-A-0 063 953；WO 84/04541，芽孢杆菌]，[Miller等人，(1988)Proc.Natl.Acad.Sci.85：856；Wang等人，(1990)J.Bacteriol.172：949，弯曲杆菌]，[Cohen等人，(1973)Proc.Natl.Acad.Sci.69：2110；Dower等人，(1988)Nucleic Acids Res.16：6127；Kushner(1978)″用ColE1-衍生的质粒转化大肠杆菌的改进的方法″GeneticEngineering：Proceedings of the International Symposium on Genetic Engineering(H.W.Boyer和S.Nicosia编辑)；Mandel等人，(1970)J.Mol.Biol.53：159；Taketo(1988)Biochim.Biophys.Acta 949：318；埃希氏菌]，[Chassy等人，(1987)FEMSMicrobiol.Lett.44：173乳酸杆菌]；[Fiedler等人，(1988)Anal.Biochem170：38，假单胞菌]；[Augustin等人，(1990)FEMS Microbiol.Lett.66：203，葡萄球菌]，[Barany等人，(1980)J.Bacteriol.144：698；Harlander(1987)″用电穿孔转化链球菌产乳酸微生物″Streptococcal Genetics(J.Ferretti和R.Curtiss III编辑)；Perry等人，(1981)Infect.Immun.32：1295；Powell等人，(1988)Appl.Environ.Microbiol.54：655；Somkuti等人，(1987)Proc.4th Evr.Cong.Biotechnology 1：412，链球菌]。

v.酵母表达

酵母表达系统也是本领域技术人员所知的。酵母启动子是能结合酵母RNA聚合酶并启动下游(3′)编码序列(如结构基因)转录成mRNA的DNA序列。启动子具有一个转录起始区，它通常位于编码序列的5′端附近。该转录起始区通常包括RNA聚合酶结合位点(″TATA″盒)以及一个转录起始位点。酵母启动子可能还有第二个功能区域称为上游激活序列(UAS)，如果存在的话，它通常在结构基因的远端。UAS能调节表达(可诱导)。在UAS不存在时，发生组成型表达。表达的调控可能是正作用或负作用的，从而增强或减弱了转录。

酵母是一种发酵生物体，具有活泼的代谢途径，因此编码代谢途径中的酶的序列提供了特别有用的启动子序列。例子包括醇脱氢酶(ADH)(EP-A-0 284 044)、烯醇酶、葡萄糖激酶、葡萄糖-6-磷酸异构酶、甘油醛-3-磷酸-脱氢酶(GAP或GAPDH)、己糖激酶、磷酸果糖激酶、3-磷酸甘油酸变位酶、以及丙酮酸激酶(PyK)(EPO-A-0 329 203)。编码酸性磷酸酶的酵母PHO5基因也提供了有用的启动子序列[Myanohara等人(1983)Proc.Natl.Acad.Sci.USA 80：1]。

另外，非天然存在的合成的启动子也可象酵母启动子一样起作用。例如，一种酵母启动子的UAS序列可以和另一种酵母启动子的转录激活区连接在一起，形成合成的杂合启动子。这种杂合启动子的例子包括与GAP转录激活区相连的ADH调控序列(美国专利No.4,876,197和4,880,734)。杂合启动子的其它例子包括由ADH2、GAL4、GAL10或PHO5基因的调控序列组成的启动子与糖酵解酶基因如GAP或PyK的转录激活区组合(EP-A-0 164 556)。另外，酵母启动子可包括非酵母来源但能结合酵母RNA聚合酶并启动转录的天然存在的启动子。这些启动子的例子包括，尤其是，[Cohen等人，(1980)Proc.Natl.Acad.Sci.USA 77：1078；Henikoff等人，(1981)Nature 283：835；Hollenberg等人，(1981)Curr. Topics Microbiol.Immunol.96：119；Hollenberg等人，(1979)″细菌抗生素抗性基因在酿酒酵母中的表达″Plasmids of Medical，Environmentaland Commercial Importance(K.N.Timmis和A.Puhler编辑)；Mercerau-Puigalon等人，(1980)Gene 11：163；Panthier等人，(1980)Curr.Genet.2：109；]。

DNA分子可以在酵母菌胞内表达。启动子序列可以直接与DNA分子相连，在这种情况下，重组蛋白N端的第一个氨基酸始终是甲硫氨酸，其由ATG起始密码子编码。如果需要，可通过和溴化氰体外培育将N端的甲硫氨酸从蛋白质上切下。

象在哺乳动物、杆状病毒以及细菌表达系统中一样，融合蛋白为酵母表达系统提供了一种备选方案。通常，将编码内源酵母蛋白或其它稳定的蛋白之N端部分的DNA序列与异源编码序列的5′端融合。在表达时，该构建物将提供这两个氨基酸序列的融合物。例如，酵母或人超氧化物歧化酶(SOD)基因可以和外源基因5′端相连并在酵母中表达。两个氨基酸序列连接处的DNA序列可能编码或不编码可切割的位点。例如参见EP-A-0 196 056。另一个例子是遍在蛋白融合蛋白。这种融合蛋白由遍在蛋白区域组成，该区域宜保留一个酶(例如遍在蛋白特异性加工蛋白酶)加工位点，以便将外源蛋白和遍在蛋白切开。因此，通过这种方法，可以分离获得天然的外源蛋白(例如WO88/024066)。

另外，还可通过产生嵌合的DNA分子来将外源蛋白从细胞分泌到生长培养基中，该嵌合的DNA分子编码的融合蛋白含有一个前导序列片段，该前导序列片段能使酵母中的外源蛋白分泌出来。较佳的，在编码的前导序列片段和外来基因之间宜具有能在体内或体外切割的加工位点。该前导序列片段通常编码了一个含有疏水性氨基酸的信号肽，其指导蛋白从细胞分泌出来。

编码合适信号序列的DNA可以从分泌性酵母蛋白的基因衍生获得，这些基因例如有酵母转化酶基因(EP-A-0 012 873；JPO.62,096,086)以及A-因子基因(美国专利4,588,684)。另外，非酵母来源的前导序列(如干扰素前导序列)的存在也能提供酵母分泌作用(EP-A-0 060 057)。

较佳的一类分泌前导序列采用了酵母α-因子基因的片段，其含有″pre″信号序列和″pro″区。可采用的α因子片段的类型包括全长pre-proα因子前导序列(约83个氨基酸残基)以及截短的α-因子前导序列(通常约25至50个氨基酸残基)(美国专利4,546,083和4,870,008；EP-A-0 324 274)。采用α-因子前导片段提供分泌作用的其它前导序列包括杂合的α-因子前导序列，其由第一个酵母的pre序列组成但无第二个酵母α因子的pro区域(例如见WO89/02463)。

通常，被酵母识别的转录终止序列是位于翻译终止密码子3′的调控区，其和启动子一起侧接在编码序列的两侧。这些序列指导mRNA的转录，而mRNA能被翻译成该DNA所编码的多肽。转录终止序列和其它酵母识别的终止序列的例子例如是编码糖酵解酶的那些转录终止序列。

上述组件，包括启动子、前导序列(如果需要)、感兴趣的编码序列以及转录终止序列，通常被一起放在表达构建物中。表达构建物通常以复制子的形式保持，例如能在宿主(如酵母或细菌)中稳定保持的染色体外元件(如质粒)。复制子可能具有两个复制系统，从而允许其能维持在例如酵母中进行表达，并能维持在原核宿主进行克隆和扩增。这些酵母-细菌穿梭载体的例子包括YEp24[Botstein等人(1979)Gene 8：17-24]，pCL/1[Brake等人，(1984)Proc.Natl.Acad.Sci.USA 81：4642-4646]和YRp17[Stinchcomb等人(1982)J.Mol.Biol.158：157]。另外，复制子可以是高拷贝数或低拷贝数的质粒。高拷贝数质粒的拷贝数大致在约5至200之间，通常在约10至150之间。含有高拷贝数质粒的宿主宜含有至少约10个质粒，更佳的含有至少约20个质粒。根据载体以及外源蛋白对宿主的影响，可以选择高拷贝数或低拷贝数的载体。例如参见Brake等人，同上。

另外，表达构建物可以和一个整合载体一起整合入酵母基因组中。整合载体通常含有至少一个与酵母染色体同源的序列，从而允许该载体整合，最好含有两个同源序列侧接该表达构建物。整合看来是载体和酵母染色体中同源DNA之间重组引起的[Orr-Weaver等人(1983)Methods in Enzymol.101：228-245]。通过选择合适的同源序列插入载体中，可将整合载体导入酵母中某一特定的基因座。见Orr-Weaver等人，同上。可以整合入一个或多个表达构建物，这可能会影响重组蛋白产生的水平[Rine等人(1983)Proc.Natl.Acad.Sci.USA 80：6750]。载体中的染色体序列可以载体中的单个片段形式存在(从而导致整个载体的整合)，或是与染色体中的相邻片段同源的两个片段，这两个片段在载体中侧接在表达构建物两侧，从而导致只有表达构建物稳定地整合。

通常，染色体外的以及整合的表达构建物均含有可选择的标记，以便选择已被转化的酵母菌株。可选择标记可包括能在酵母宿主中表达的生物合成基因(如ADE2、HIS4、LEU2、TRP1和ALG7以及G418抗性基因)，这些基因分别赋予酵母细胞对衣霉素以及G418的抗性。另外，合适的可选择标记还可能为酵母在毒性化合物(如金属)存在下提供生长能力。例如，CUP1的存在使酵母能在铜离子存在下生长[Butt等人，(1987)Microbiol，Rev.51：351]。

已经开发出了用于转化入许多酵母中的表达和转化载体(无论是染色体外复制子还是整合载体)。例如，尤其已经开发出用于下列酵母菌的表达载体：白色念珠菌[Kurtz，等人，(1986)Mol.Cell Biol.6：142]，麦芽糖念珠菌[Kunze，等人，(1985)J.Basic Microbiol.25：141]，多形汉逊酵母[Gleeson，等人，(1986)J.Gen.Microbiol.132：3459；Roggenkamp等人，(1986)Mol.Gen.Genet.202：302]，脆壁克鲁维酵母[Das，等人，(1984)J.Bacteriol.158：1165]，乳酸克鲁维酵母[De Louvencourt等人，(1983)J.Bacteriol.154：737；Van den Berg等人，(1990)Bio/Technology8：135]，季也蒙毕赤酵母[Kunze等人，(1985)J.Basic Microbiol.25：141]，巴斯德毕赤酵母[Cregg，等人，(1985)Mol.Cell.Biol.5：3376；美国专利No.4,837,148和4,929,555]，酿酒酵母[Hinnen等人，(1978)Proc.Natl.Acad.Sci.USA 75：1929；Ito等人，(1983)J.Bacteriol.153：163]，栗酒裂植酵母[Beach和Nurse(1981)Nature 300：706]，以及Yarrowialipolytica[Davidow，等人，(1985)Curr.Genet 10：380471 Gaillardin，等人，(1985)Curr.Genet.10：49]。

将外源DNA导入酵母宿主的方法是本领域熟知的，通常包括用碱阳离子处理原生质球或完整酵母细胞进行转化。转化程序通常因待转化的酵母种类而异。例如参见，[Kurtz等人，(1986)Mol.Cell.Biol.6：142；Kunze等人，(1985)J.Basic Microbiol.25：141；念珠菌属]；[Gleeson等人，(1986)J.Gen.Microbiol.132：3459；Roggenkamp等人，(1986)Mol.Gen.Genet.202：302；汉逊酵母]；[Das等人，(1984)J.Bacteriol.158：1165；De Louvencourt等人，(1983)J.Bacteriol.154：1165；Van den Berg等人，(1990)Bio/Technology8：135；克鲁维酵母]；[Cregg等人，(1985)Mol.Cell.Biol.5：3376；Kunze等人，(1985)J.Basic Microbiol.25：141；美国专利No.4,837,148和4,929,555；毕赤酵母]；[Hinnen等人，(1978)Proc.Natl.Acad.Sci.USA 75；1929；Ito等人，(1983)J.Bacteriol.153：163酿酒酵母]；[Beach和Nurse(1981)Nature 300：706；裂殖酵母]；[Davidow等人，(1985)Curr.Genet.10：39；Gaillardin等人，(1985)Curr.Genet.10：49；Yarrowia]。

抗体

本文所用的术语“抗体”指由至少一个抗体结合位点组成的一个或一组多肽。“抗体结合位点”是一个三维结合空间，其内表面形状和电荷分布与抗原表位的特征互补，从而使抗体与抗原结合。“抗体”例如包括，脊椎动物抗体、杂合抗体、嵌合抗体、人化抗体、经修饰的抗体、单价抗体、Fab蛋白以及单结构域抗体。

针对本发明蛋白的抗体可用于亲和层析、免疫试验以及区别/鉴定奈瑟氏球菌蛋白。

针对本发明蛋白的多克隆和单克隆抗体可用常规方法制得。通常，首先用蛋白来免疫合适的动物，较佳的是小鼠、大鼠、家兔或山羊。由于可获得的血清体积较大，能获得标记的抗家兔和抗山羊抗体，因此对于制备多克隆血清来说，家兔和山羊是较佳的。免疫通常这样进行：将蛋白混合或乳化到盐水(较佳的是佐剂如Freund完全佐剂)中，然后肠胃外(通常是皮下或肌内)注射该混合物或乳剂。每次注射50-200微克的剂量通常就足够了。2-6周后用盐水(较佳的是用Freund不完全佐剂)配的蛋白质注射一次或多次以强化免疫。另外可以用本领域已知的方法进行体外免疫来产生抗体，从本发明的目的来看，认为其与体内免疫等效。多克隆抗血清这样获得：将免疫后的动物血液抽取到玻璃或塑料容器中，25℃培育该血液1小时，然后4℃培育2-18小时。离心(例如1000g 10分钟)回收血清。家兔每次取血可获得约20-50毫升。

用Kohler和Milstein的标准方法[Nature(1975)256：495-96]或其改进方法制备单克隆抗体。通常，如上所述对小鼠或大鼠免疫。然而，并非是对动物取血然后抽提血清，而是取出脾脏(以及任选地取出几个大的淋巴结)，将其分离成单细胞。如果需要，可将细胞悬液(在除去非特异性粘附的细胞后)加入包被了蛋白质抗原的板或孔中，对脾细胞进行筛选。表达抗原特异性的膜结合免疫球蛋白的B细胞结合到板上，不象悬液其它物质那样被洗去。然后使所得B细胞或所有解离的脾细胞与骨髓瘤细胞融合形成杂交瘤，培养在选择性培养基(如次黄嘌呤、氨基蝶呤、胸苷培养基，“HAT”)中。通过有限稀释接种所得杂交瘤，并测定特异性结合免疫抗原(且不结合无关抗原)的抗体的产生。然后，体外(例如在组织培养瓶或中空纤维反应器中)或体内(如小鼠腹水中)培养所选的分泌单克隆抗体的杂交瘤。

如果需要，抗体(无论是多克隆还是单克隆抗体)可用常规技术来标记。合适的标记包括荧光团、发色团、放射活性原子(特别是³²P和¹²⁵I)、密电子试剂、酶、以及具有特异性结合配偶的配体。酶通常靠其活性来检测。例如，辣根过氧化物酶通常是检测其将3，3′，5，5′-四甲基联苯胺(TMB)转变成蓝色的能力，可用分光光度计定量测定。“特异性结合配偶”指能以高特异性结合配体分子的蛋白质，例如抗原以及对其有特异性的单克隆抗体的情况。其它特异性结合配偶包括生物素和亲和素或链霉亲和素，IgG和蛋白A，以及本领域已知的许多受体-配体对。应理解，上述内容并非要将各种标记分成不同的类，因为同一标记可在几种不同的模型中起作用。例如，¹²⁵I可作为放射活性标记，或作为密电子试剂。HRP可作为酶或单抗的抗原。另外，可将各种标记组合以获得所需的效果。例如，在实施本发明中，单抗和亲和素也需要标记，因此，可以用生物素标记单抗，并用标记了¹²⁵I的亲和素检测其存在，或用标记HRP的抗生物素单抗检测其存在。其它替换和可能性对于本领域普通技术人员来说是显而易见的，所以应认作是属于本发明范围的等价物。

药物组合物

药物组合物可包含本发明的多肽、抗体或核酸。该药物组合物将包含治疗有效量的本发明的多肽、抗体或多核苷酸。

本文所用的术语“治疗有效量”指治疗剂治疗、缓解或预防目标疾病或状况的量，或是表现出可检测的治疗或预防效果的量。该效果例如可通过化学标记或抗原水平来检测。治疗效果也包括生理性症状的减少，例如体温降低。对于某一对象的精确的有效量取决于该对象的体型和健康状况、病症的性质和程度、以及选择给予的治疗剂或治疗剂的组合。因此，预先指定准确的有效量是没用的。然而，对于某给定的状况而言，可以用常规实验来确定该有效量，临床医师是能够判断出来的。

为了本发明的目的，有效的剂量为给予个体约0.01毫克/千克至50毫克/千克或0.05毫克/千克至10毫克/千克的DNA构建物。

药物组合物还可含有药学上可接受的载体。术语“药学上可接受的载体”指用于治疗剂(例如抗体、多肽、基因或其它治疗剂)给药的载体。该术语指这样一些药剂载体：它们本身不诱导产生对接受该组合物的个体有害的抗体，且给药后没有过分的毒性。合适的载体可能是大的、代谢缓慢的大分子，如蛋白质、多糖、聚乳酸(polylacticacid)、聚乙醇酸、氨基酸聚合物、氨基酸共聚物以及无活性的病毒颗粒。这些载体是本领域普通技术人员所熟知的。

本文可用的药学上可接受的盐例如有：无机酸盐，如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等；以及有机酸的盐，如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。在Remington′sPharmaceutical Sciences(Mack Pub.Co.，N.J.1991)中可找到关于药学上可接受的赋形剂的充分讨论。

治疗性组合物中的药学上可接受的载体可含有液体，如水、盐水、甘油和乙醇。另外，这些载体中还可能存在辅助性的物质，如润湿剂或乳化剂、pH缓冲物质等。通常，可将治疗性组合物制成可注射剂，例如作为液体溶液或悬液；还可制成在注射前适合在液体载体中配成溶液或悬浮液的固体形式。脂质体也包括在该药学上可接受的载体定义中。

输药方法

一旦配成本发明的组合物，可将其直接给予对象。待治疗的对象可以是动物；尤其可以治疗人。

直接输送该组合物通常可通过皮下、腹膜内、静脉内或肌内注射或输送至组织间隙来实现。组合物也可输送至病灶区。其它给药方式包括口服和肺给药、栓剂和透皮或经皮肤应用(例如参见WO98/20734)、用针、基因枪或手持喷雾器(hypospray)。治疗剂量方案可以是单剂方案或多剂方案。

疫苗

本发明的疫苗可以是预防性的(即防止感染)或治疗性的(即在感染后治疗疾病)。

这些疫苗包含免疫性抗原、免疫原、多肽、蛋白或核酸，通常与“药学上可接受的载体”组合，这些载体包括本身不诱导产生对接受该组合物的个体有害的抗体的任何载体。合适的载体通常是大的、代谢缓慢的大分子，如蛋白质、多糖、聚乳酸、聚乙醇酸、氨基酸聚合物、氨基酸共聚物、脂质凝集物(如油滴或脂质体)以及无活性的病毒颗粒。这些载体是本领域普通技术人员所熟知的。另外，这些载体可作为免疫刺激剂(“佐剂”)。另外，抗原或免疫原可以和细菌类毒素(如白喉、破伤风、霍乱、幽门螺杆菌等病原体的类毒素)偶联。

增强组合物效果的较佳的佐剂包括但不局限于：(1)铝盐(alum)，如氢氧化铝、磷酸铝、硫酸铝等；(2)水包油的乳剂配方(有或没有其它特异性的免疫刺激剂，如胞壁酰肽(见下文)或细菌细胞壁成分)，例如，例(a)MF59^TM(WO90/14837；《疫苗设计：亚基和佐剂方法》第10章，编者Powell和Newman，Plenum Press 1995)，其含有5％鲨烯、0.5％吐温80和0.5％Span 85(任选地含有不同量的MTP-PE(见下文)，虽然并不需要)，用微量流化器(如110Y型微量流化器(Microfluidics，Newton，MA))制成亚微米级颗粒；(b)SAF，其含有10％鲨烯、0.4％吐温80、5％普卢兰尼克(pluronic)嵌段聚合物L121以及thr-MDP(见下文)，微量流化成亚微米级乳剂或涡流振荡产生粒径较大的乳剂，和(c)Ribi^TM佐剂系统(RAS)(Ribi Immunochem，Hamilton，MT)，其含有2％鲨烯、0.2％吐温80以及取自单磷酰脂A(MPL)、二霉菌酸海藻糖酯(TDM)、和细胞壁骨架(CWS)的一种或多种细菌细胞壁组分，较佳的是MPL+CWS(Detox^TM)；(3)皂素佐剂，例如可采用Stimulon^TM(Cambridge Bioscience，Worcester，MA)或从其产生的颗粒，如ISCOM(免疫刺激性复合物)；(4)Freund完全佐剂(CFA)和Freund不完全佐剂(IFA)；(5)细胞因子，如白介素(如IL-1、IL-2、IL-4、IL-5、IL-6、IL-7、IL-12等)、干扰素(如γ干扰素)、巨噬细胞集落刺激因子(M-CFS)、肿瘤坏死因子(TNF)等；以及(6)作为免疫刺激剂来增强组合物效果的其它物质。Alum和MF59^TM是较佳的。

如上所述，胞壁酰肽包括但不局限于，N-乙酰-胞壁酰-L-苏氨酰-D-异谷氨酰胺(thr-MDP)、N-乙酰-去胞壁酰-L-丙氨酰-D-异谷氨酰胺(nor-MDP)、N-乙酰胞壁酰-L-丙氨酰-D-异谷氨酰氨酰基-L-丙氨酸-2-(1′-2′-二棕榈酰-sn-甘油-3-羟基磷酰氧)-乙胺(MTP-PE)等。

免疫原性组合物(如免疫用抗原/免疫原/多肽/蛋白质/核酸，药学上可接受的载体以及佐剂)通常含有稀释剂，如水，盐水，甘油，乙醇等。另外，辅助性物质，如润湿剂或乳化剂、pH缓冲物质等可存在于该此类载体中。

通常，可将免疫原性组合物制成可注射剂，例如作为液体溶液或悬液；还可制成在注射前适合配入液体载体形成溶液或悬液的固体形式。该制剂还可乳化或包封在脂质体中，在上述药学上可接受的载体下增强佐剂效果。

用作疫苗的免疫原性组合物包含免疫学有效量的抗原性或免疫原性多肽，以及上述其它所需的组分。“免疫学有效量”指以单剂或连续剂一部分给予个体的量对治疗或预防是有效的。该用量取决于待治疗个体的健康状况和生理状况、待治疗个体的种类(如非人灵长类等)、个体免疫系统合成抗体的能力、所需的保护程度、疫苗的配方、治疗医师对医疗状况的评估、及其它的相关因素而定。预计该用量将在相对较宽的范围内，可通过常规实验来确定。

常规方法是从肠胃外(皮下、肌内、或透皮/经皮肤(如WO98/20734))途径通过注射给予免疫原性组合物。适合其它给药方式的其它配方包括口服和肺制剂、栓剂和透皮应用。治疗剂量可以是单剂方案或多剂方案。疫苗可以结合其它免疫调节剂一起给予。

作为以蛋白质为基础的疫苗的备选方案，可以采用DNA疫苗接种[例如，Robinson和Torres(1997)Seminars in Immunology 9：271-283；Donnelly等人(1997)Annu Rev.Immunol 15：617-648；见下文]。

基因输送载体

用于输送构建物的基因治疗载体可以口服或全身性给予，其中所述构建物包括本发明治疗剂的编码序列，将其输送给哺乳动物以便在哺乳动物体内表达。这些构建物可利用体内或活体外方式中的病毒或非病毒载体方法。这些编码序列的表达可用内源哺乳动物启动子或异源启动子诱导。编码序列的体内表达可以是组成型的或受调控的。

本发明包括能表达所涉及的核酸序列的基因输送载体。基因输送载体宜为病毒载体，更佳的是逆转录病毒、腺病毒、腺伴随病毒(AAV)、疱疹病毒或甲病毒载体。病毒载体还可以是星状病毒、冠状病毒、正粘病毒、乳多空病毒、副粘病毒、细小病毒、小核糖核酸病毒、痘病毒或披膜病毒的病毒载体。通常参见Jolly(1994)Cancer GeneTherapy 1：51-64；Kimura(1994)Human Gene Therapy 5：845-852；Connelly(1995)Human Gene Therapy 6：185-193；以及Kaplitt(1994)Nature Genetics 6：148-153。

逆转录病毒载体是本领域中熟知的，我们认为任何逆转录病毒基因治疗载体均可用于本发明，包括B、C和D型逆转录病毒、异嗜性逆转录病毒(例如NZB-X1、NZB-X2和NZB9-1(见O′Neill(1985)J.Virol.53：160)广食性逆转录病毒如MCF和MCF-MLV(见Kelly(1983)J.Virol 45：291)、泡沫病毒和慢病毒。见《RNA肿瘤病毒》第2版，ColdSpring Harbor Laboratory，1985。

逆转录病毒基因治疗载体的诸部分可从不同逆转录病毒衍生获得。例如，逆转录载体LTR可以从鼠肉瘤病毒衍生获得，tRNA结合位点可以从Rous肉瘤病毒衍生获得，包装信号从鼠白血病病毒获得，第二链的合成起点从禽类白血病病毒获得。

可将这些重组逆转录病毒载体导入合适的包装细胞系，用来产生转导感受态逆转录病毒载体颗粒(见美国专利5,591,624)。通过将嵌合性整合酶掺入逆转录病毒颗粒，构建逆转录病毒载体，以便将其定点整合到宿主细胞DNA中(见WO96/37626)。较佳的是重组病毒载体是复制缺陷型重组病毒。

适合与上述逆转录病毒载体使用的包装细胞系是本领域中熟知的，很容易制得(见WO95/30763和WO92/05266)，并能用来产生能生产重组载体颗粒的生产型细胞系(也称为载体细胞系或“VCL”)。包装细胞系宜从人亲代细胞(如HT1080细胞)或貂亲代细胞系制得，以便消除人血清的灭活作用。

用来构建逆转录病毒基因治疗载体的较佳的逆转录病毒包括禽类白血病病毒、牛白血病病毒、鼠白血病病毒、水貂细胞灶诱导病毒、鼠肉瘤病毒、网状内皮组织增殖病毒和Rous肉瘤病毒。特别佳的鼠白血病病毒包括4070A和1504A(Hartley和Rowe(1976)J Virol 19：19-25)，Abelson(ATCC No.VR-999)，Friend(ATCCNo.VR-245)，Graffi，Gross(ATCC Nol VR-590)，Kirsten，Harvey肉瘤病毒和Rauscher(ATCC No.VR-998)以及莫洛尼鼠白血病病毒(ATCC No.VR-190)。这些逆转录病毒可以从保藏机构或保藏中心如Rockville，Maryland的美国典型培养物保藏中心(ATCC)获得，或用常用的技术从已知来源分离获得。

可用于本发明的典型的已知逆转录病毒基因治疗载体包括在以下专利申请中描述的那些载体：GB2200651，EP0415731，EP0345242，EP0334301，WO89/02468；WO89/05349，WO89/09271，WO90/02806，WO90/07936，WO94/03622，WO93/25698，WO93/25234，WO93/11230，WO93/10218，WO91/02805，WO91/02825，WO95/07994，US 5,219,740，US 4,405,712，US 4,861,719，US 4,980,289，US 4,777,127，US 5,591,624.另见Vile(1993)Cancer Res 53：3860-3864；Vile(1993)Cancer Res 53：962-967；Ram(1993)Cancer Res 53(1993)83-88；Takamiya (1992)J Neurosci Res 33：493-503；Baba(1993)J Neurosurg 79：729-735；Mann(1983)Cell 33：153；Cane(1984)Proc Natl AcadSci 81：6349；以及Miller(1990)Human Gene Therapy1。

人腺病毒基因治疗载体也是本领域中已知的，可用于本发明。例如参见Berkner(1988)Biotechniques 6：616和Rosenfeld(1991)Science 252：431，以及WO93/07283，WO93/06223和WO93/07282。可用于本发明的典型的已知的腺病毒基因治疗载体包括在上述文献以及下述专利中描述的那些例子：WO94/12649，WO93/03769，WO93/19191，WO94/28938，WO95/11984，WO95/00655，WO95/27071，WO95/29993，WO95/34671，WO96/05320，WO94/08026，WO94/11506，WO93/06223，WO94/24299，WO95/14102，WO95/24297，WO95/02697，WO94/28152，WO94/24299，WO95/09241，WO95/25807，WO95/05835，WO94/18922和WO95/09654。另外，可以采用Curiel(1992)Hum.Gene Ther.3：147-154中描述的给予和已杀死腺病毒相连的DNA的方法。本发明的基因输送载体还包括腺病毒伴随病毒(AAV)载体。用于本发明的这种载体的主要且较佳的例子是Srivastava，WO93/09239中公开的AAV-2为基的载体。最佳的AAV载体包含两个AAV反向末端重复序列，其中通过核苷酸替换对天然D-序列进行修饰，使至少5-18个天然的核苷酸(较佳的至少10-18个天然核苷酸，最佳的10个天然核苷酸)被保留下来，而D-序列其余的核苷酸缺失或被非天然核苷酸取代。AAV末端反向重复序列的天然D-序列是每个AAV反向末端重复序列中不参与HP形成的20个连串核苷酸的序列(即每一端有一个序列)。非天然的替换核苷酸可以是天然D-序列同一位置中所见核苷酸以外的任何核苷酸。其它可采用的典型的AAV载体是pWP-19、pWN-1，两者均公开在Nahreini(1993)Gene 124：257-262中。这样的AAV的另一个例子是psub201(见Samulski(1987)J.Virol.61：3096)。另一个典型的AAV载体是Double-DITR载体。Double-D ITR载体的构建方案公开在美国专利5,478,745中。还有其它的载体公开在Carter的美国专利4,797,368和Muzyczka的美国专利5,139,941、Chartejee的美国专利5,474,935和Kotin的WO94/288157中。可用于本发明的另一个AAV载体例子是SSV9AFABTKneo，它含有AFP增强子和白蛋白启动子，并且主要指导肝内表达。其结构和构建方案公开在Su(1996)Human Gene Therapy 7：463-470中。其它的AAV基因治疗载体在美国专利5,354,678，5,173,414，5,139,941和5,252,479中有所描述。

本发明的基因治疗载体还包括疱疹载体。主要且较佳的例子是含有编码胸苷激酶多肽的序列的单纯疱疹病毒载体，如公开在US5,288,641和EP0176170(Roizman)中的那些。其它典型的单纯疱疹病毒载体包括WO95/04139中公开的HFEM/ICP6-LacZ(Wistar Institute)、Geller(1988)Science 241：1667-1669以及WO90/09441和WO92/07945中公开的pHSVlac、Fink(1992)Human Gene Therapy 3：11-19中描述的HSV Us3::pgC-lacZ、EP 0453242(Breakefield)中描述的HSV 7134、2 RH 105和GAL4以及保藏于ATCC、保藏号为ATCC VR-977和ATCC VR-260的那些病毒。

还考虑到甲病毒基因治疗载体也可用于本发明。较佳的甲病毒载体是新培斯病毒载体。披膜病毒、Semliki Forest病毒(ATCC VR-67；ATCC VR-1247)、Middleberg病毒(ATCC VR-370)、Ross River病毒(ATCC VR-373；ATCC VR-1246)、委内瑞拉马脑炎病毒(ATCC VR923；ATCC VR-1250；ATCC VR-1249；ATCC VR-532)、以及在美国专利5,091,309，5,217,879以及WO92/10578中描述的那些。更具体地说，可以采用1995年3月15日提交的美国申请08/405,627、WO94/21792、WO92/10578、WO95/07994、US 5,091,309和US 5,217,879中描述的那些甲病毒载体。这些甲病毒可以从保藏机构或保藏中心如Rockville，Maryland的ATCC获得，或用常用的技术从已知来源分离获得。较佳的是，采用细胞毒性减少的甲病毒载体(见USSN08/679640)。

DNA载体系统，如真核分层的(layered)表达系统，也可用于表达本发明的核酸。关于真核分层的表达系统详见WO95/07994。较佳的，本发明的真核分层表达系统宜从甲病毒载体衍生获得，更佳的从新培斯病毒载体衍生获得。

适用于本发明的其它病毒载体包括：从脊髓灰质炎病毒衍生的病毒载体，例如ATCC VR-58以及在Evans，Nature 339(1989)385和Sabin(1973)J.Biol.Standardization 1：115中描述的那些；鼻病毒，例如ATCC VR-1110以及在Arnold(1990)J Cell Biochem L401中描述的那些；痘病毒，如金黄色痘病毒或牛痘病毒，例如ATCCVR-111和ATCC VR-2010，以及在Fisher-Hoch(1989)Proc Natl Acad Sci 86：317；Flexner(1989)Ann NY Acad Sci 569：86，Flexner(1990)Vaccine 8：17；US 4,603,112，US4,769,330以及WO89/01973中描述的那些；SV40病毒，例如ATCC VR-305以及在Mulligan(1979)Nature 277：108和Madzak(1992)J Gen Virol 73：1533中描述的那些；流感病毒，例如ATCC VR-797以及用例如US 5,166,057和Enami(1990)Proc Natl AcadSci 87：3802-3805；Enami和Palese(1991)J Virol 65：2711-2713；Luytjes(1989)Cell59：110中所述的用反基因技术制得的重组流感病毒(另见McMichael(1983)NEJ Med309：13，Yap(1978)Nature 273：238以及Nature(1979)277：108)；EP-0386882和Buchschacher(1992)J.Virol.66：2731中描述的人免疫缺陷病毒；麻疹病毒，例如ATCCVR-67和VR-1247，以及EP-0440219中描述的那些；奥拉病毒，例如ATCC VR-368；Bebaru病毒，例如ATCC VR-600和ATCC VR-1240；Cabassou病毒，例如ATCCVR-922；屈曲病毒，例如ATCC VR-64和ATCC VR-1241；Fort Morgan病毒，例如ATCC VR-924；Getah病毒，例如ATCC VR-369和ATCC VR-1243；Kyzylagach病毒，例如ATCC VR-927；Mayaro病毒，例如ATCC VR-66；Mucambo病毒，例如ATCCVR-580和ATCC VR-1244；Ndumu病毒，例如ATCC VR-371；Pixuna病毒，例如ATCC VR-372和ATCC VR-1245；Tonate病毒，例如ATCC VR-925；Triniti病毒，例如ATCC VR-469；Una病毒，例如ATCC VR-374；Whataroa病毒，例如ATCC VR-926；Y-62-33病毒，例如ATCC VR-375；O′Nyong病毒，东部脑炎病毒，例如ATCC VR-65和ATCC VR-1242；西部脑炎病毒，例如ATCC VR-70，ATCC VR-1251，ATCC VR-622和ATCC VR-1252；和冠状病毒，例如ATCC VR-740和在Hamre(1966)Proc Soc ExpBiolMed 121：190中描述的那些。

将本发明的组合物输送至细胞内并不局限于上述病毒载体。还可采用其它输送方法和介质，例如核酸表达载体、与已被杀死的腺病毒单独相连或不相连的聚阳离子凝缩的DNA(例如参见1994年12月30日美国申请No.08/366,787和Curiel(1992)HumGene Ther 3：147-154)、配体连接的DNA(例如参见Wu(1989)J.Biol.Chem.264：16985-16987)、真核细胞输送载体细胞(例如参见1994年5月9日提交的美国申请No.08/240,030以及美国申请No.08/404,796)、光聚合水凝胶材料的沉淀、手提式基因转移颗粒枪(如美国专利5,149,655所述)、电离辐射(如US5,206,152和WO92/11033所述)、核电荷中和或与细胞膜融合。其它方法在Philip(1994) Mol CellBiol 14：2411-2418以及Woffendin(1994)Proc.Natl.Acad.Sci.91：1581-1585中有所描述。

可以采用颗粒介导的基因转移，例如参见美国申请No.60/023,867。简言之，可将序列插入含有控制高水平表达的常规序列的常规载体中，然后和合成性基因转移分子一起培育，这些基因转移分子例如是聚合性DNA-结合阳离子(如聚赖氨酸、鱼精蛋白和白蛋白)，其与细胞寻靶配体(如脱唾液酸血清类粘蛋白(如Wu和Wu(1987)J.Biol.Chem.262：4429-4432所述)、胰岛素(如Hucked(1990)Biochem Pharmacol 40：253-263所述)、半乳糖(如Plank(1992)Bioconjugate Chem 3：533-539所述)、乳糖或运铁蛋白相连。

还可使用裸露的DNA。典型的裸露DNA导入方法在WO 90/11902和US5,580,859中有所描述。用可生物降解的乳胶珠可以改善摄取效果。在对珠粒的胞吞作用开始后，包裹DNA的乳胶珠粒被有效地运输到细胞中。通过处理珠粒以提高其疏水性可进一步改进该方法，从而有助于破坏核内体和将DNA释放到细胞质中。

可作为基因输送载体的脂质体在US 5,422,120，WO95/13796，WO94/23697，WO91/14445和EP-524,968中有所描述。如USSN 60/023,867中所描述的，在非病毒输送时，可将编码多肽的核酸序列插入含有控制高水平表达的常规序列的常规载体中，然后和合成性基因转移分子一起培育，这些基因转移分子例如是聚合性DNA-结合阳离子(如聚赖氨酸、鱼精蛋白和白蛋白)，其与细胞寻靶配体(如脱唾液酸血清类粘蛋白、胰岛素、半乳糖、乳糖或运铁蛋白)相连。其它输送系统包括采用脂质体来包裹DNA，该DNA所含基因在各种组织特异性或活性普遍存在的启动子控制下。适用的其它非病毒输送系统包括机械输送系统，如Woffendin等人(1994)Proc.Natl.Acad.Sci.USA 91(24)：11581-11585中描述的方法。另外，该系统的编码序列和表达产物可以通过光聚合的水凝胶材料的沉淀来输送。可用来输送编码序列的其它常规基因输送方法例如包括，用手提式基因转移颗粒枪(如美国专利5,149,655所述)；用电离辐射来激活转移的基因(如US 5,206,152和WO92/11033所述)。

典型的脂质体和聚阳离子基因输送载体在下列文献中有所描述：US 5,422,120和4,762,915；WO95/13796；WO94/23697；WO91/14445；EP-0524968；Stryer，Biochemistry，236-240页(1975)W.H.Freeman，San Francisco；Szoka(1980)BiochemBiophys Acta 600：1；Bayer(1979)Biochem Biophys Acta 550：464；Rivnay(1987)MethEnzymol 149：119；Wang(1987)Proc Natl Acad Sci 84：7851；Plant(1989)Anal Biochem176：420。

多核苷酸组合物可包含治疗有效量的基因治疗载体，其定义如上所述。出于本发明的目的，有效的剂量是给予个体约0.01毫克/千克至50毫克/千克或0.05毫克/千克至10毫克/千克的DNA构建物。

输送方法

一旦配制成后，本发明的多核苷酸组合物可以以下方式给予：(1)直接给予对象；(2)活体外输送至从对象衍生获得的细胞；或(3)体外表达重组蛋白。待治疗的对象可以是哺乳动物或鸟类。另外，也可对人进行治疗。

直接输送该组合物通常可通过皮下、腹膜内、静脉内或肌内注射或输送至组织间隙来实现。组合物也可给予病灶区。其它给药方式包括口服和肺给药、栓剂和透皮或经皮肤应用(例如参见WO98/20734)、用针、基因枪或手持喷雾器(hypospray)。治疗剂量方案可以是单剂方案或多剂方案。

活体外输送以及将转化的细胞重新植入对象体内的方法是本领域所熟知的，在例如WO93/14778中有所描述。用于活体外应用的细胞例子例如包括：干细胞、尤其是造血干细胞、淋巴细胞、巨噬细胞、树突细胞或肿瘤细胞。

通常，对于活体外和体外应用，核酸的输送可通过以下步骤来实现，例如有葡聚糖介导的转染、磷酸钙沉淀、Polybrene介导的转染、原生质体融合、电穿孔、将多核苷酸包囊在脂质体中以及将DNA直接显微注射到胞核中，所有这些均是本领域所熟知的。

多核苷酸和多肽药物组合物

除了上述的药学上可接受的载体和盐外，多核苷酸和多肽组合物中还可采用下列附加试剂。

A.多肽

一个例子是多肽，其包括但不局限于：脱唾液酸血清类粘蛋白(ASOR)；运铁蛋白；脱唾液酸糖蛋白；抗体；抗体片段；铁蛋白；白介素；干扰索；粒细胞-巨噬细胞集落刺激因子(GM-CSF)；粒细胞集落刺激因子(G-CSF)、巨噬细胞集落刺激因子(M-CSF)、干细胞因子和促红细胞生成素。还可使用病毒抗原，如包膜蛋白。另外，可用来自其它侵袭性生物的蛋白，例如恶性疟疾疟原虫的环孢子蛋白的17个氨基酸的肽(称为RII)。

B.激素，维生素等

其它可包括的种类例如是：激素、类固醇、雄激素、雌激素、甲状腺激素或维生素、叶酸。

C.聚亚烷基、多糖等

另外，聚(亚烷基)二醇可以和所需的多核苷酸/多肽组合在一起。在一个较佳的实施方案中，聚(亚烷基)二醇是聚乙二醇。另外，可以加入单糖、二糖或多糖。在此方面的一个较佳实施方案中，多糖是葡聚糖或DEAE-葡聚糖。另外有脱乙酰壳多糖和聚交酯-聚乙醇酸内酯共聚物。

D.脂质和脂质体

所需的多核苷酸/多肽还可在输送给对象或对象衍生的细胞之前包裹在脂质中或包裹在脂质体中。

脂质包裹通常用能稳定结合或捕获并保留核酸的脂质体来实现。凝缩的多核苷酸与脂质制剂之比可以变化，但是通常在约1∶1(毫克DNA∶微摩尔脂质)左右，或脂质多些。关于脂质体作为输送核酸的载体的综述参见Hug和Sleight(1991)Biochim.Biophys.Acta.1097：1-17；Straubinger(1983)Meth.Enzymol.101：512-527。

用于本发明的脂质体制剂包括阳离子(带正电荷)、阴离子(带负电荷)和中性制剂。阳离子脂质体已证明能以有功能的形式介导质粒DNA的胞内输送(Felgner(1987)Proc.Natl.Acad.Sci.USA 84：7413-7416)；mRNA(Malone(1989)Proc.Natl.Acad.Sci.USA86：6077-6081)；和纯化的转录因子(Debs(1990)J.Biol.Chem.265：10189-10192)的胞内输送。

阳离子脂质体很容易购得。例如，N[1-2，3-二油烯基氧)丙基]-N，N，N-三乙铵(DOMTA)脂质体可以Lipofectin的商品名从GIBCO BRL，Grand Island，NY购得。(另见Felgner，同上)。其它市售的脂质体包括transfectace(DDAB/DOPE)和DOTAP/DOPE(Boerhinger)。其它阳离子脂质体可用本领域熟知的方法从易购得的材料制得。例如参见，Szoka(1978)PNAS 75：4194-4198；WO90/11092关于合成DOTAP(1，2-二(油酰基氧)-3-(三甲基铵溶)丙烷)脂质体的描述。

同样，阴离子和中性脂质体也很容易获得，例如购自Avanti PolarLipids(birmingham，AL)，或容易用易购得的材料制得。这些材料包括磷脂酰胆碱、胆固醇、磷脂酰乙醇胺、二油酰基磷脂酰胆碱(DOPC)、二油酰基磷脂酰甘油(DOPG)、二油酰基磷脂酰乙醇胺(DOPE)。这些材料还能以合适比例与DOTMA和DOTAP原料混合。用这些材料制备脂质体的方法是本领域熟知的。

脂质体可包含多层泡囊(MLV)，小的单层泡囊(SUV)、或大的单层泡囊(LUV)。各种脂质体-核酸复合物可用本领域已知的方法制得。例如参见Straubinger(1983)Meth.Immunol.101：512-527；Szoka(1978)Proc.Natl.Acad.Sci.USA 75：4194-4198；Papahadjopoulos(1975)Biochim.Biophys.Acta 394：483；Wilson(1979)Cell17：77)；Deamer和Bangham(1976)Biochim.Biophys.Acta 443：629；Ostro(1977)Biochem.Biophys.Res.Commun.76：836；Fraley(1979)Proc.Natl.Acad.Sci.USA 76：3348)；Enoch和Strittmatter(1979)Proc.Natl.Acad.Sci.USA 76：145；Fraley(1980)J.Biol.Chem.(1980)255：10431；Szoka和Papahadjopoulos(1978)Proc.Natl.Acad.Sci.USA 75：145；以及Schaefer-Ridder(1982)Science 215：166。

E.脂蛋白

另外，脂蛋白也可加入待输送的多核苷酸/多肽中。采用的脂蛋白的例子包括：乳糜微粒、HDL、IDL、LDL和VLDL。还可采用这些蛋白的突变体、片段或融合物。另外，可采用天然存在的脂蛋白的修饰物，例如乙酰化的LDL。这些脂蛋白能使多核苷酸的输送指向表达脂蛋白受体的细胞。较佳的，如果待输送的多核苷酸中加入了脂蛋白，则组合物中不加入其它寻靶配体。

天然存在的脂蛋白包含脂质和蛋白部分。蛋白部分称为脱辅基蛋白。目前，已经分离并鉴定了脱辅基蛋白A、B、C、D和E。其中至少有两个含有几种蛋白，用罗马数字AI、AII、AIV；CI、CII、CIII命名。

脂蛋白可包含多个脱辅基蛋白。例如，天然存在的乳糜微粒包含A、B、C和E，随着时间的推移，这些脂蛋白失去A，得到C和E脱辅基蛋白。VLDL包含A、B、C、和E脱辅基蛋白，LDL包含脱辅基蛋白B；HDL包含脱辅基蛋白A、C和E。

这些脱辅基蛋白的氨基酸是已知的，并且在下列文献中有所描述：Breslow(1985)Annu Rev.Biochem 54：699；Law(1986)Adv.Exp Med.Biol.151：162；Chen(1986)J BiolChem 261：12918；Kane(1980)Proc Natl Acad Sci USA 77：2465；和Utermann(1984)Hum Genet 65：232。

脂蛋白含有各种脂质，包括甘油三酯、胆固醇(游离的和酯型)以及磷脂。天然存在的脂蛋白中脂质的组成是不同的。例如，乳糜微粒主要含甘油三酯。关于天然存在的脂蛋白的脂质含量更详细的描述可在例如Meth.Enzymol.128(1986)中找到。选择脂质的组成，以使脱辅基蛋白的构型与受体结合活性相符。还可选择脂质的组成，以促进与多核苷酸结合分子的疏水性相互作用和结合。

天然存在的脂蛋白可以用诸如超离心方法从血清中分离出来。这些方法在Meth.Enzymol.(同上)；Pitas(1980)J.BioChem.255：5454-5460以及Mahey(1979)J Clin.Invest64：743-750中有所描述。脂蛋白还可在体外产生，或通过在所需宿主细胞中表达脱辅基蛋白基因的重组方法产生。例如参见Atkinson(1986)Annu Rev Biophys Chem 15：403和Radding(1958)Biochim Biophys Acta 30：443。脂蛋白也可购自商业供应商，如Biomedical Techniologies，Inc.，Stoughton，Massachusetts，USA。关于脂蛋白的进一步描述可在Zuckermann等人的PCT/US97/14465中找到。

F.聚阳离子试剂

聚阳离子试剂可以与或不与脂蛋白一起包括在含待输送的所需多核苷酸/多肽的组合物中。

聚阳离子试剂通常在生理性相关的pH下表现出净的正电荷，并能中和核酸的电荷，以有助于输送至所需位置。这些试剂具有体外、活体外和体内的用途。聚阳离子试剂可通过肌内或皮下等途径将核酸输送至活的对象。

下面是用作聚阳离子试剂的多肽例子：聚赖氨酸、聚精氨酸、聚鸟氨酸和鱼精蛋白。其它例子包括组蛋白、鱼精蛋白、人血清白蛋白、DNA结合蛋白、非组蛋白染色体蛋白、DNA病毒的外壳蛋白，如(X174，转录因子还含有结合DNA的结构域，因此可用作核酸浓缩剂。简言之，转录因子如C/CEBP、c-jun、c-fos、AP-1、AP-2、AP-3、CPF、Prot-1、Sp-1、Oct-1、Oct-2、CREP、和TFIID含有结合DNA序列的基础性结构域。

聚阳离子有机试剂包括：精胺、亚精胺和腐胺。

从上面的清单可以推出聚阳离子试剂的尺寸和生理性能，以构建其它多肽聚阳离子试剂或产生合成的聚阳离子试剂。

可采用的合成聚阳离子试剂例如包括，DEAE-葡聚糖、polybrene。Lipofectin^TM和lipofectAMINE^TM是和多核苷酸/多肽组合时形成聚阳离子复合物的单体。

免疫诊断试验

本发明的奈瑟氏球菌抗原可用于免疫试验来检测抗体水平(或相反，可用抗奈瑟氏球菌抗体来检测抗原水平)。根据明确的免疫试验，可以开发出重组抗原，以代替侵入性诊断性方法。针对生物学样品(例如包括血液或血清样品)中的奈瑟氏球菌蛋白的抗体可以被检测出来。免疫试验的设计可作很大变化，其各种方案均是本领域中已知的。免疫试验的方案可采取例如竞争性、或直接反应或夹心型试验。例如方案还可采用固体支持物，或可以采用免疫沉淀法。大多数试验涉及采用有标记的抗体或多肽；该标记例如可以是荧光标记、化学发光标记、放射活性标记或染料分子。放大探针信号的试验也是已知的；其例子是采用生物素和亲和素的试验，酶标记的和介导的免疫试验，如ELISA试验。

将合适的材料(包括本发明的组合物)以及进行试验所需的其它试剂和材料(例如合适的缓冲液、盐溶液等)和合适的试验说明书包装到合适的容器中，构成适用于免疫诊断且含有适当标记试剂的试剂盒。

核酸杂交

“杂交”指两个核酸序列相互之间通过氢键而结合。通常，一个序列被固定到固体载体中，另一个将游离于溶液内。然后，在有利于形成氢键的条件下使两个序列相互接触。影响这种结合的因素包括：溶剂的类型和体积；反应温度；杂交时间；搅拌；封闭液相序列与固相载体非特异性附着的试剂(Denhardt′s试剂或BLOTTO)；序列的浓度；是否用化合物来增加序列结合的速度(硫酸葡聚糖或聚乙二醇)；以及杂交后洗涤条件的严谨程度。见Sambrook等人[同上]第2卷，第9章，9.47至9.57页。

“严谨性”指有利于非常相似的序列与不同序列发生结合的杂交反应条件。例如，应选择温度和盐浓度的组合，使温度比所研究的杂交物的Tm计算值低大约120至200℃。温度和盐浓度在前期初步实验中常可通过经验来确定，在初步实验中，固定在滤膜上的基因组DNA样品与感兴趣的序列杂交，然后在不同的严谨度条件下洗涤。见Sambrook等人第9.50页。

在进行例如Southern印迹时，要考虑的变量是(1)待印迹的DNA的复杂性以及(2)探针与受检测序列之间的同源性。对于高度复杂的真核基因组中的单拷贝基因，待研究片段的总量可以在10的一个数量级范围内变化，质粒为0.1至1微克，或将噬菌体消化至10^-9至10^-8克。对于复杂性较低的多核苷酸，可以采用实际上更短的印迹、杂交以及接触时间，更少量的起始多核苷酸，以及比活更低的探针。例如，从1微克酵母DNA开始，用仅仅1小时的接触时间，印迹2小时，然后和10⁸cpm/μg的探针杂交4-8小时，就可以检测出单拷贝酵母基因。对于单拷贝哺乳动物基因而言，一种保守的方法是从10微克DNA开始，印迹过夜，在10％硫酸葡聚糖存在下用10⁸cpm/μg以上的探针杂交过夜，导致接触时间约为24小时。

有几个因素可能会影响探针与感兴趣片段之间的DNA-DNA杂交体的解链温度(Tm)，因而影响杂交和洗涤的合适条件。在许多情况下，探针并非与片段100％同源。其它常常遇到的变量包括杂交序列的长度和G+C总含量，以及杂交缓冲液的离子强度和甲酰胺含量。所有这些因素的作用可近似表示成一个方程式：

Tm＝81+16.6(log₁₀Ci)+0.4[％(G+C)]-0.6(％甲酰胺)-600/n-1.5(％错配)

其中Ci是盐浓度(单价离子)，n是杂交物碱基对的长度(对Meinkoth和Wahl(1984)Anal.Biochem.138：267-284中的稍稍作了修改)。

在设计杂交实验时，影响核酸杂交的一些因素可以方便地予以改变。杂交和洗涤时的温度以及洗涤时的盐浓度的调节最为简单。随着杂交温度(即严谨度)的升高，非同源链之间发生杂交的可能性变得更少，结果背景值降低。如果放射性标记的探针并非与固定的片段完全同源(这在基因家族和种间杂交实验中是常见的)，则必须降低杂交温度，而背景值将会增加。洗涤温度以类似的方式影响杂交带的强度和背景值的程度。洗涤的严谨性也随盐浓度的降低而升高。

通常，在50％甲酰胺存在下的方便的杂交温度是：对于靶片段同源性达95％至100％的探针而言，是42℃；对于同源性为90％至95％的探针，为37℃；对于同源性为85％和90％的探针，为32℃。对于较低的同源性，应用上述方程式应相应地降低甲酰胺含量和调节温度。如果探针和靶片段之间的同源性是未知的，则最简单的方法是从非严谨的杂交和洗涤条件开始。如果在放射自显影后发现了非特异性的条带或高背景值，则可在高严谨性下洗涤滤膜，并重新曝光。如果曝光所需时间使得该方法不切实际，则应平行检验几种杂交和/或洗涤严谨性。

核酸探针试验

采用本发明的核酸探针的方法(如PCR、分支DNA探针试验或印迹技术)能确定cDNA或mRNA的存在。如果探针和本发明的序列能形成稳定地足以被检测到的双链体或双链复合物，则称探针与本发明的序列“杂交”。

核酸探针将与本发明的奈瑟氏球菌核苷酸序列(包括有义和反义链)杂交。尽管有许多不同的核苷酸序列编码该氨基酸序列，但是天然的奈瑟氏球菌序列是较佳的，因为它是实际存在于细胞中的序列。mRNA代表一种编码序列，因此探针应与该编码序列互补；单链cDNA与mRNA互补，因此cDNA探针应与非编码序列互补。

探针序列无需和奈瑟氏球菌序列(或其互补体)相同，序列以及长度的一些差异能增加试验的灵敏度，如果核酸探针能和靶核苷酸形成能被检测的双链体的话。另外，核酸探针可包括其它核苷酸，以使形成的双链体稳定。其它奈瑟氏球菌序列也是有帮助的，可作为检测形成的双链体的标记。例如，非互补的核苷酸序列可以和探针的5′端相连，探针序列的其余部分与奈瑟氏球菌序列互补。或者，非互补的碱基或较长的序列能散布到探针中，只要探针序列与奈瑟氏球菌序列有足够的互补性以便与其杂交从而形成能被检测的双链体。

探针的确切长度和序列将取决于杂交条件，如温度，盐浓度等。例如，对于诊断应用，根据分析物序列的复杂程度，核酸探针通常含有至少10-20个核苷酸，较佳的有15-25个，更佳的有至少30个核苷酸，但是也可短于该长度。短的引物通常需要温度较低，以便和模板形成足够稳定的杂交复合物。

探针可用合成方法产生，例如Matteucci等人[J.Am.Chem.Soc.(1981)103：3185]的方法或Urdea等人[Proc.Natl.Acad.Sci.USA(1983)80：7461]的方法，或用市售的自动寡核苷酸合成仪合成。

可以根据偏好选择探针的化学性质。对于某些应用，DNA或RNA是合适的。对于其它的应用，可以加入修饰，例如骨架修饰，如硫代磷酸酯或甲基磷酸酯，可用来增加体内半衰期，改变RNA亲和力，增加核酸酶抗性等[例如参见Agrawal和Iyer(1995)Curr Opin Biotechnol 6：12-19；Agrawal(1996)TIBTECH 14：376-387]；还可采用类似物如肽核酸[例如参见Corey(1997)TIBTECH 15：224-229；Buchardt等人(1993)TIBTECH 11：384-386]。

另外，聚合酶链反应(PCR)是另一个熟知的检测少量靶核酸的手段。该试验在Mullis等人[Meth.Enzymol.(1987)155：335-350]；美国专利4,683,195和4,468,202中有所描述。用两个“引物”核苷酸与靶核酸杂交，来引导反应。引物可包含不与扩增靶序列(或其互补序列)杂交的序列，以帮助双链体的稳定性，或例如可插入一个简便的限制性位点。这些序列通常侧接所需的奈瑟氏球菌序列。

利用最初的靶核酸作为模板，热稳定的聚合酶能从引物产生靶核酸的拷贝。在聚合酶产生临界量的靶核酸后，它们可用较传统的方法(如Southern印迹)来检测。当采用Southern印迹方法时，标记的探针将与奈瑟氏球菌序列(如其互补序列)杂交。

另外，mRNA或cDNA也可用Sambrook等人[同上]描述的传统印迹技术来检测。用凝胶电泳可纯化并分离利用聚合酶从mRNA产生的mRNA或cDNA。然后，将凝胶上的核酸印迹到固相载体如硝酸纤维素上。使固相载体与标记的探针接触，然后洗涤除去所有未杂交的探针。然后，检测含有标记探针的双链体。该探针通常用放射活性物质作标记。

附图简述

图1-7显示了实施例1、2、3、7、13、16和19中ORF40、38、44、52、114、41和124的序列分析和生化数据。M1和M2是分子量标记。箭头表示主要重组产物的位置，或在Western印迹中，表示主要的脑膜炎奈瑟氏球菌免疫反应性条带的位置。TP表示脑膜炎奈瑟氏球菌总蛋白抽提物；OMV表示脑膜炎奈瑟氏球菌外膜泡囊制备物。在杀菌试验的结果中：菱形(◆)表示免疫前的数据；三角(▲)表示GST对照数据；圆圈(●)表示脑膜炎奈瑟氏球菌重组蛋白的数据。计算机分析显示了亲水性曲线(上方)、抗原性指数曲线(中间)以及AMPHI分析(下方)。用AMPHI程序预测T-细胞表位[Gao等人(1989)J.Immunol.143：3007；Roberts等人(1996)AIDS Res Hum Retrovir12：593；Quakyi等人(1992)Scand J Immunol增版11：9]，该程序可从DNASTAR，Inc(1228 South Park Street，Madison，Wisconsin 53715 USA)的Protean软件包中获得。

具体实施方式

下列实施例描述已经在脑膜炎奈瑟氏球菌中鉴定的核酸序列及其推定的翻译产物。并非所有的核酸序列都是完整的，即它们编码的不是全长野生型蛋白。认为目前本文所述的所有DNA序列没有一个在淋病奈瑟氏球菌中有明显的同系物。

实施例总体上采用下列形式：

●脑膜炎奈瑟氏球菌(B株)中已作鉴定的核苷酸序列

●该序列推定的翻译产物

●根据数据库比较的翻译产物的计算机分析结果

●脑膜炎奈瑟氏球菌(A株)中鉴定的对应的基因和蛋白序列

●暗示可能具有合适抗原性的蛋白的特性描述

●生物化学分析(表达、纯化、ELISA、FACS等)的结果

实施例通常包括细菌种属和株系之间的序列同源性细节情况。序列相似的蛋白质其结构和功能通常是相似的，同源性通常表示有共同的进化起源。广泛采用了与功能已知的蛋白序列进行比较，作为赋予新序列推定蛋白功能的指南，在全基因组分析中证明这是特别有用的。

在NCBI(http：//www.ncbi.nlm.nih.gov)用BLAST、BLAST2、BLASTn、BLASTp、tBLASTn、BLASTx、和tBLASTx算法进行序列比较[例如参见Altschul等人(1997)″Gapped BLAST和PSI-BLAST：新一代的蛋白数据库搜索程序″Nucleic AcidsResearch 25：2289-3402]。对下列数据库进行搜索：非冗长的GenBank+EMBL+DDBJ+PDB序列和非冗长的GenBank CDS翻译+PDB+SwissProt+SPupdate+PIR序列。

核苷酸序列中的点(例如实施例12中的288位)代表为了维持读码框而任意导入的核苷酸。同样，除去带双划线的核苷酸。小写字母(如实施例12中的589位)代表在独立测序反应的序列对比时出现了多义性(实施例中的一些核苷酸序列是通过合并两个或多个实验的结果而获得的)。

用根据Esposti等人[″膜蛋白亲水性的关键评价″(1990)Eur J Biochem 190：207-219]的统计研究的算法，扫描了所有6个读码框中的核苷酸序列，以预测疏水性结构域的存在。这些结构域代表潜在的跨膜区域或疏水性前导序列。

用ORFFINDER程序(NCBI)从片段化的核苷酸序列预测开放读框。

有下划线的氨基酸序列代表用PSORT算法(http：//www.psort.nibb.acjp)估测出的ORF中可能的跨膜区域或前导序列。还用MOTIFS程序(GCG Wisconsin和PROSITE)预测了功能性结构域。

可用各种试验来评价实施例中鉴定的蛋白的体内免疫原性。例如，可以重组方式表达这些蛋白质，并用于免疫印迹筛选患者血清。蛋白和患者血清之间发生阳性反应表明该患者以前已经建立了对该所述蛋白的免疫应答，即该蛋白是免疫原。该方法还可用来鉴定免疫优势蛋白。

重组蛋白还可方便地用来例如在小鼠中制备抗体。这些抗体可用来直接确认蛋白位于细胞表面。将标记的抗体(例如对于FACS为荧光标记)与完整的细菌培育，细菌表面出现标记确认了该蛋白的位置。

具体地说，采用下列方法(A)至(S)，来表达、纯化和分析本发明蛋白的生物化学特性：

A)染色体DNA制备

使脑膜炎奈瑟氏球菌2996菌株在100毫升GC培养基中生长至指数期，离心收获，重悬于5毫升缓冲液(20％蔗糖、50毫摩尔Tris-HCl、50毫摩尔EDTA、pH8)中。冰上培育10分钟后，加入10毫升裂解溶液(50毫摩尔NaCl，1％Na-十二烷基肌氨酸钠，50微克/毫升蛋白酶K)裂解该细菌，37℃培育悬液2小时。用苯酚抽提两次(平衡至pH8)，用三氯甲烷/异戊醇(24∶1)抽提一次。加入0.3M乙酸钠和2体积乙醇，使DNA沉淀，离心收集。用70％乙醇洗涤沉淀一次，重新溶解在4毫升缓冲液(10毫摩尔Tris-HCl，1毫摩尔EDTA，pH8)中。读取260纳米下OD值，测定DNA浓度。

B)寡核苷酸设计

用(a)脑膜炎球菌B的序列(当能获得时)，或(b)淋球菌/脑膜炎球菌A序列(按需适应于脑膜炎球菌密码子偏好利用率)，根据各ORF的编码序列，设计合成的寡核苷酸引物。推导紧靠预计的前导序列下游5′端扩增引物序列，忽略任何预计的信号肽。

5′引物包括两个限制性酶识别位点(BamHI-NdeI，BamHI-NheI或EcoRI-NheI，这取决于基因自身的限制性方式)；3′引物包括一个XhoI限制性位点。建立该步骤是为了指导各扩增产物(对应于各ORF)克隆到以下两个不同的表达系统中：pGEX-KG(用BamHI-XhoI或EcoRI-XhoI)，以及pET21b+(用NdeI-XhoI或NheI-XhoI)。

5’-端引物尾序列： CGC GGATCCCATATG (BamHI-NdeI)

CGC GGATCCGCTAGC (BamHI-NheI)

CCG GAATTCTA GCTAGC (EcoRI-NheI)

3’-端引物尾序列： CCCG CTCGAG (XhoI)

引物不仅含有限制性酶识别序列，而且还包括与待扩增序列杂交的核苷酸。杂交核苷酸的数目取决于整个引物的解链温度，对于各引物可用下式测定：

Tm＝4(G+C)+2(A+T) (扫除尾部)

Tm＝64.9+0.41(％GC)-600/N (整个引物)

对于整个寡核苷酸来说，所选寡核苷酸的平均解链温度为65-70℃，对于单单杂交区来说，平均解链温度为50-55℃。

表1显示了用于每一次扩增的正向和反向引物。用Perkin Elmer 394 DNA/RNA合成仪合成寡核苷酸，用2毫升氢氧化铵从柱上洗脱下，56℃培育5小时去保护。加入0.3M乙酸钠和2体积乙醇，使寡核苷酸沉淀。然后离心样品，将沉淀重悬于100微升或1毫升水中。用Perkin ElmerλBio分光光度计测定OD₂₆₀，测得浓度，调节至2-10pmol/微升。

C)扩增

标准的PCR程序如下：在20-40微摩尔各寡核苷酸、400-800微摩尔dNTP溶液、1×PCR缓冲液(包括1.5毫摩尔氯化镁)、2.5单位TaqI DNA聚合酶(用Perkin-ElmerAmpliTaQ，GIBCO Platinum，Pwo DNA聚合酶或Tahara Shuzo Taq聚合酶)存在下，用50-200ng基因组DNA作为模板。

在一些例子中，通过加入10微升DMSO或50微升2M甜菜碱来优化PCR。

加热开始后(在95℃初步培育整个混合物3分钟期间加入聚合酶)，每个样品经历两个步骤的扩增：开头5轮的进行用排除限制性酶尾部的寡核苷酸的解链温度作为杂交温度，随后的30轮根据全长寡核苷酸的杂交温度来进行。这些轮后是最后在72℃下延伸10分钟。

标准循环如下：

	变性	杂交	延伸
	变性	杂交	延伸	前5轮	30秒95℃	30秒50-55℃	30-60秒72℃
后30轮	30秒95℃	30秒65-70℃	30-60秒72℃	前5轮	30秒95℃	30秒50-55℃	30-60秒72℃

延伸时间随待扩增ORF的长度不同而不同。

扩增用9600或2400 Perkin Elmer GeneAmp PCR系统进行。为了检查结果，将1/10的扩增体积装载到1-1.5％琼脂糖凝胶上，将各扩增片段的大小与DNA分子量标记作比较。

将扩增的DNA直接上样到1％琼脂糖凝胶上，或是先用乙醇沉淀，然后重悬于合适的体积中，上样到1％琼脂糖凝胶上。然后用Qiagen凝胶抽提试剂盒按照生产商说明从凝胶中洗脱并纯化获得对应于大小正确条带的DNA片段。该DNA片段的最终体积为30微升或50微升的水，或10毫摩尔Tris，pH8.5。

D)PCR片段的消化

将对应于扩增片段的纯化的DNA分成2等份，用以下物质进行双重消化：

-NdeI/XhoI或NheI/XhoI，用于克隆到pET-21b+中，该蛋白进一步表达成C-端His-尾融合物

-BamHI/XhoI或EcoRI/XhoI，用于克隆到pGEX-KG中，该蛋白进一步表达成N-端GST融合物

-EcoRI/PstI，EcoRI/SalI，SalI/PstI，用于克隆到pGex-His中，该蛋白进一步表达成N-端His-尾融合物

在合适的缓冲液存在下，使各纯化DNA片段与20单位的各种限制性酶(NewEngland Biolabs)在30或40微升的最终体积中培育(37℃培育3小时至过夜)。然后用QIAquick PCR纯化试剂盒按照生产商说明书纯化消化产物，洗脱到最终体积为30微升或50微升的水中或10毫摩尔Tris-HCl(pH8.5)中。在滴定的分子量标记存在下，通过1％琼脂糖凝胶电泳测定最终的DNA浓度。

E)克隆载体(pET22B，pGEX-KG，pTRC-His A和pGex-His)的消化

在合适的缓冲液存在下，使200微升反应体积中的限制性酶各50单位与10微克质粒37℃培育过夜，对10微克质粒进行双消化。在将全部消化物上样到1％琼脂糖凝胶上后，用Qiagen QIAquick凝胶抽提试剂盒从凝胶中纯化对应于消化载体的条带，将DNA洗脱到50微升10毫摩尔Tris-HCl，pH8.5中。测定样品的OD₂₆₀，评价其DNA浓度，并调节至50微克/微升。每个克隆步骤采用1微升质粒。

pGEX-His载体是经修饰的pGEX-2T载体，其在凝血酶断裂位点上游携带有一个编码6个组氨酸残基的区域，而且还含有载体pTRC99(Pharmacia)的多个克隆位点。

F)克隆

将预先消化和纯化的对应于各ORF的片段连接到pET22b和pGEX-KG中。在20微升的最终体积中，在生产商提供的缓冲液存在下，用0.5微升NEB T4 DNA连接酶(400单位/微升)连接摩尔比为3∶1的片段/载体。室温培育反应3小时。在一些实验中，用Boehringer的″快速连接试剂盒″按照生产商说明书进行连接。

为了将重组质粒导入合适的菌株内，使100微升大肠杆菌DH5感受态细胞与连接酶反应溶液于冰上培育40分钟，然后37℃3分钟，加入800微升LB肉汤后，再37℃培育20分钟。然后在Eppendorf微量离心机中以最大速度离心细胞，重悬于约200微升上清液中。然后将悬液接种到LB氨苄青霉素(100毫克/毫升)平板上。

使5个随机选择的菌落在2毫升(pGEX或pTC克隆)或5毫升(pET克隆)LB肉汤+100微克/毫升氨苄青霉素中37℃生长过夜，对重组克隆进行筛选。然后，使细胞沉淀，用Qiagen QIAprep旋转微量制备试剂盒，按照生产商说明书，将DNA抽提到最终体积为30微升。用NdeI/XhoI或BamHI/XhoI消化5微升各个微量制备物(约1微克)，将整个消化物上样到1-1.5％琼脂糖凝胶上(取决于预计的插入物大小)，与分子量标记(1Kb DNA梯序列，GIBCO)平行。根据正确的插入物大小筛选出阳性克隆。

G)表达

将克隆到表达载体中的每个ORF转化入适合表达重组蛋白产物的菌株中。用1微升各构建物转化上述30微升大肠杆菌BL21(pGEX载体)、大肠杆菌TOP10(pTRC载体)或大肠杆菌BL21-DE3(pET载体)。在pGEX-His载体例子中，用相同的大肠杆菌菌株(W3110)进行最初的克隆和表达。将单个重组菌落接种到2毫升LB+Amp(100微克/毫升)中，37℃培育过夜，然后1∶30稀释在100毫升瓶中的20毫升LB+Amp(100微克/毫升)中，确保OD₆₀₀在0.1至0.15之间。将瓶培育在30℃回转水浴摇床中，直至OD表明达到适合诱导表达的指数生长(pET和pTRC载体的OD为0.4-0.8；pGEX和pGEX-His载体的OD为0.8-1)。对于pET，pTRC和pGEX-His载体，加入1毫摩尔IPTG，诱导蛋白质表达，而在pGEX系统情况下，IPTG的最终浓度为0.2毫摩尔。30℃培育3小时后，测OD检查样品的最终浓度。为了检查表达，取出各样品1毫升，在微量离心机中离心，将沉淀重悬于PBS中，用12％SDS-PAGE和考马斯蓝染色分析。6000g离心整个样品，将沉淀重悬于PBS中待用。

H)GST-融合蛋白大规模纯化

使单菌落在LB+Amp琼脂板上37℃培育过夜。将细菌接种到水浴摇床中20毫升LB+Amp培养液中，生长过夜。将细菌1∶30稀释到600毫升新鲜培养基中，使其在最适温度(20-37℃)下生长至OD₅₅₀为0.8-1。用0.2毫摩尔IPTG诱导蛋白质表达，然后培育3小时。4℃、8000rpm离心培养物。弃去上清液，将细菌沉淀重悬于7.5毫升冷的PBS中。用Branson超声波仪B-15在冰上40W超声破碎细胞30秒种，冻融2次，再次离心。收集上清液，与150微升谷胱苷肽-Sepharose 4B树脂(Pharmacia)(先用PBS洗涤)混合，室温培育30分钟。4℃、700g离心样品5分钟。用10毫升冷的PBS洗涤树脂2次10分钟，重悬于1毫升冷PBS中，上样于一次性柱中。用2毫升冷PBS洗柱2次，直至流穿液OD₂₈₀达到0.02-0.06。加入700微升冷的谷胱苷肽洗脱缓冲液(10毫摩尔还原的谷胱苷肽，50毫摩尔Tris-HCl)，洗脱GST-融合蛋白，收集组分直至OD₂₈₀为0.1。将各组分2 1微升上样于12％SDS凝胶上，凝胶采用BioradSDS-PAGE分子量标准宽范围(M1)(200，116.25，97.4，66.2，45，31，21.5，14.4，6.5kDa)或Amersham Rainbow标记(M2)(220，66，46，30，21.5，14.3kDa)作为标准。因为GST的MW为26kDa，因此该值必须加入各GST-融合蛋白的MW中。

I)His-融合物溶解度分析

为了分析His-融合物表达产物的溶解度，将3毫升培养物沉淀重悬于缓冲液M1[500微升PBS，pH7.2]中。加入25微升溶菌酶(10毫克/毫升)，4℃培育细菌15分钟。用Branson超声仪B-15以40W超声破碎沉淀30秒，冻融两次，然后再次离心分离成沉淀和上清液。收集上清液，将沉淀重悬于缓冲液M2[8M尿素，0.5M氯化钠，20毫摩尔咪唑和0.1M磷酸二氢钠]中，4℃培育3-4小时。离心后，收集上清液，将沉淀重悬于缓冲液M3[6M盐酸胍，0.SM氯化钠，20毫摩尔咪唑和0.1M磷酸二氢钠]中，4℃过夜。用SDS-PAGE分析所有步骤的上清液。

J)His融合物大规模纯化

使单菌落在LB+Amp琼脂板上37℃培育过夜。将细菌接种到20毫升LB+Amp培养液中，在水浴摇床中培育过夜。将细菌1∶30稀释到600毫升新鲜培养基中，使其在最适温度(20-37℃)下生长至OD₅₅₀为0.6-0.8。加入1毫摩尔IPTG诱导蛋白质表达，进一步培育该培养物3小时。4℃、8000rpm离心培养物，弃去上清液，将细菌沉淀重悬于7.5毫升(i)冷的缓冲液A(300毫摩尔氯化钠，50毫摩尔磷酸缓冲液，10毫摩尔咪唑，pH8，针对可溶性蛋白)或(ii)缓冲液B(尿素8M，10毫摩尔Tris-HCl，100毫摩尔磷酸缓冲液，pH8.8，针对不溶性蛋白)。

用Brason超声波仪B-15于40W在冰上超声破碎细胞30秒种，冻融2次，再次离心。

对于不溶性蛋白，-20℃保藏上清液，而将沉淀重悬于2毫升缓冲液C(6M盐酸胍，100毫摩尔磷酸缓冲液，10毫摩尔Tris-HCl，pH7.5)中，在匀化器中处理10个循环。13000rpm离心产物40分钟。

收集上清液，与150微升Ni₂₊ ^-树脂(Pharmacia)(先用合适的缓冲液A或缓冲液B洗涤)，室温下轻微搅动培育30分钟。4℃，700g离心样品5分钟。用10毫升缓冲液A或B洗涤树脂二次10分钟，重悬于1毫升缓冲液A或B中，上样于一次性柱中。用2毫升冷的缓冲液A4℃洗涤树脂，或在室温下用2毫升缓冲液B洗涤树脂，直至流穿液OD₂₈₀达到0.02-0.06。

用以下缓冲液洗涤树脂：(i)2毫升冷的20毫摩尔咪唑缓冲液(300毫摩尔氯化钠，50毫摩尔磷酸缓冲液，20毫摩尔咪唑，pH8)或(ii)缓冲液D(尿素8M，10毫摩尔Tris-HCl，100毫摩尔磷酸缓冲液，pH6.3)，直至流穿液OD₂₈₀达到0.02-0.06。加入700微升的(i)冷的洗脱缓冲液A(300毫摩尔氯化钠，50毫摩尔磷酸缓冲液，250毫摩尔咪唑，pH8)或(ii)洗脱缓冲液B(尿素8M，10毫摩尔Tris-HCl，100毫摩尔磷酸缓冲液，pH4.5)，洗脱His-融合蛋白，收集组分直至OD₂₈₀为0.1。将各组分21微升上样于12％SDS凝胶中。

K)His-融合蛋白复性

在变性的蛋白中加入10％甘油。然后用透析缓冲液I(10％甘油，0.5M精氨酸，50毫摩尔磷酸缓冲液，5毫摩尔还原的谷胱苷肽，0.5毫摩尔氧化的谷胱苷肽，2M尿素，pH8.8)将蛋白质稀释至20微克/毫升，用相同的缓冲液4℃透析12-14小时。用透析缓冲液II(10％甘油，0.5M精氨酸，50mM磷酸缓冲液，5毫摩尔还原的谷胱苷肽，0.5毫摩尔氧化的谷胱苷肽，pH8.8)进一步4℃透析蛋白质12-14小时。用下式评价蛋白浓度：

蛋白质(毫克/毫升)＝(1.55×OD₂₈₀)-(0.76×OD₂₆₀)

L)His-融合物大规模纯化

用上述步骤诱导500毫升细菌培养物，获得可溶于缓冲液M1、M2或M3的融合蛋白。将细菌粗提物上样于Ni-NTA superflow柱(Quiagen)，根据融合蛋白的溶解缓冲液，用缓冲液M1、M2或M3预先平衡该柱。用相同缓冲液洗柱，洗脱未结合的物质。用含有500毫摩尔咪唑的相应缓冲液洗脱特异性蛋白，用不含咪唑的相应缓冲液透析。每一轮后，在下次使用前用至少两个柱体积的0.5M氢氧化钠洗涤，对柱进行清洁，并重新平衡。

M)小鼠免疫

用各纯化蛋白20微克腹膜内免疫小鼠。在ORF44的情况下，用氢氧化铝作为佐剂，在第1、21和42天免疫CD1小鼠，监测第56天所取样品中的免疫应答。对于ORF 40，用Freund佐剂，而不是氢氧化铝，免疫CD1小鼠，采用相同的免疫方案，只是在第42天而非56天测定免疫应答。同样，对于ORF38，用Freund佐剂免疫CD1小鼠，但是在第49天测定免疫应答。

N)ELISA试验(血清分析)

将无荚膜MenB M7菌株接种到巧克力琼脂板上，37℃培育过夜。用无菌挑菌拭子收集琼脂板的细菌菌落，接种到7毫升含0.25％葡萄糖的Mueller-Hinton肉汤(Difco)中。跟踪OD₆₂₀每30分钟监测细菌生长。使细菌长至OD达到0.3-0.4。10000rpm离心培养物10分钟。弃去上清液，用PBS洗涤细菌1次，重悬于含0.025％甲醛的PBS中，室温培育2小时，然后4℃搅拌过夜。在96孔Greiner板的每个孔中加入100微升细菌细胞，4℃培育过夜。然后用PBT洗涤缓冲液(0.1％吐温-20，PBS配)洗涤孔三次。每个孔中加入200微升饱和缓冲液(含2.7％聚乙烯吡咯烷酮10的水)，37℃培育平板2小时。用PBT洗涤各孔3次。每个孔中加入200微升稀释的血清(稀释缓冲液：1％BSA，0.1％吐温-20，0.1％叠氮钠，PBS配)，37℃培育平板90分钟。用PBT洗孔三次。在每个孔中加入100微升以稀释缓冲液1∶2000稀释的HRP-偶联的家兔抗小鼠(Dako)血清，37℃培育平板90分钟。用PBT缓冲液洗涤孔三次。在每个孔中加入100微升HRP的底物缓冲液(25毫升柠檬酸缓冲液pH5，10毫克邻苯二胺和10微升水)，使平板在室温下放置20分钟。在每个孔中加入100微升硫酸，并跟踪OD₄₉₀。当OD₄₉₀为各自免疫前血清OD值的2.5倍时，认为ELISA呈阳性。

O)FACScan细菌结合试验程序

将无荚膜MenB M7菌株接种到巧克力琼脂板上，37℃培育过夜。用无菌挑菌拭子收集琼脂板上的细菌菌落，接种到8毫升含0.25％葡萄糖的Mueller-Hinton肉汤(Difco)的4个试管中。跟踪OD₆₂₀，每30分钟监测细菌生长。使细菌长至OD达到0.35-0.5。4000rpm离心培养物10分钟。弃去上清液，将沉淀重悬于封闭缓冲液(1％BSA，0.4％叠氮钠)中，4000rpm离心5分钟。将细胞重悬于封闭缓冲液中，至OD₆₂₀为0.07。在Costar 96孔板的每个孔中加入100微升细菌细胞。在每个孔中加入100微升稀释(1∶200)血清(封闭缓冲液配)，4℃培育平板2小时。4000rpm离心细胞5分钟，吸出上清液，每个孔中加入200微升封闭缓冲液，洗涤细胞。在每个孔中加入1∶100稀释的R-Phicoerytrin偶联的F(ab)₂山羊抗小鼠抗体，4℃培育平板1小时。4000rpm离心5分钟，使细胞旋转沉淀，在每个孔中加入200微升封闭缓冲液进行洗涤。吸出上清液，将细胞重悬于每孔200微升PBS和0.25％甲醛中。将样品转移到FACScan管中读数。FACScan设置的条件为：FL1，开，FL2和FL3关；FSC-H临界值：92；FSC PMT电压：E 02；SSC PMT：474；Amp.Gains 7.1；FL-2 PMT：539；补偿值：0。

P)OMV制备

使细菌在5GC平板上生长过夜，用挑菌环收获，重悬于10毫升20毫摩尔Tris-HCl中。56℃热灭活30分钟，在冰上超声破碎该细菌10分钟(50％负载循环，50％输出)。5000g离心10分钟，除去未破碎的细胞，4℃、50000g离心75分钟，回收全部细胞包膜组分。为了从粗制的外膜中抽提出细胞质膜蛋白，将全部组分重悬于2％十二烷基肌氨酸钠(Sigma)中，室温培育20分钟。10000g离心该悬浮液10分钟，除去凝聚物，对上清液进一步50000g超离心75分钟，使外膜沉淀。将外膜重悬于10毫摩尔Tris-HCl，pH8，用BioRad蛋白质试验以BSA为标准品测定蛋白浓度。

Q)全抽提物制备

使细菌在GC板上生长过夜，用挑菌环收获，重悬于1毫升20毫摩尔Tris-HCl中。56℃热灭活30分钟。

R)Western印迹

将MenB菌株2996的纯化蛋白(每条泳道500ng)、外膜泡囊(5微克)和全细胞抽提物(25微克)上样于15％SDS-PAGE中并转移到硝酸纤维素膜上。转移在4℃、150mA、转移缓冲液(0.3％Tris碱，1.44％甘氨酸，20％甲醇)中进行2小时。在饱和缓冲液(10％脱脂乳、0.1％Triton X100，PBS配)中4℃培育过夜，使该膜饱和。用洗涤缓冲液(3％脱脂乳，0.1％Triton X100，PBS配)洗涤该膜两次，并与洗涤缓冲液1∶200稀释的小鼠血清37℃培育2小时。洗涤该膜两次，和稀释度为1∶2000的辣根过氧化物酶标记的抗小鼠Ig培育90分钟。用含0.1％Triton X100的PBS洗涤该膜两次，用Opti-4CN底物试剂盒(Bio-Rad)显影。加入水，终止反应。

S)杀菌试验

使MC58菌株在巧克力琼脂板上37℃生长过夜。收集5-7个菌落，用于接种7毫升Mueller-Hinton肉汤。在章动器上37℃培育该悬浮液，使其生长至OD₆₂₀为0.5-0.8。将培养液等分到1.5毫升无菌Eppendorf管中，在微量离心机中以最大速度离心20分钟。以Gey′s缓冲液(Gibco)洗涤沉淀一次，重悬于相同缓冲液中，至OD₆₂₀为0.5，以Gey′s缓冲液稀释1∶20000，25℃保藏。

在96孔组织培养板的每个孔中加入50微升Gey′s缓冲液/1％BSA。在每个孔中加入25微升稀释的小鼠血清(1∶100稀释在Gey′s缓冲液/0.2％BSA中)，4℃培育平板。将25微升前述细菌悬浮液加入每个孔中。每个孔中加入25微升热灭活(56℃水浴30分钟)或正常的幼兔补体。在加入幼兔补体后，立即将每个孔中22微升的样品接种到Mueller-Hinton琼脂板(时间0)。37℃转动培育96孔板1小时，然后将每个孔内22微升的样品接种到Mueller-Hinton琼脂板(时间1)上。过夜培育后，计数对应于时间0和时间1的菌落。

表II给出了克隆、表达和纯化结果的小结。

实施例1

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 1>：

1 ..ACACTGTTGT TTGCAACGGT TCAGGCAAG T GCTAACCAAT GAAGAGCAAG

51 AAGAAGATTT ATATTTAGAC CCCGTACAAC GCACTGTTGC CGTGTTGATA

101 GTCAATTCCG ATAAAGAAGG CACGGGAGAA AAAGAAAAAG TAGAAGAAAA

151 TTCAGATTGG GCAGTATATT TCAACGAGAA AGGAGTACTA ACAGCCAGAG

201 AAATCACCyT CAAAGCCGGC GACAACCTGA AAATCAAACA AAACGGCACA

251 AACTTCACCT ACTCGCTGAA AAAAGACCTC AcAGATCTGA CCAGTGTTGG

301 AACTGAAAAA TTATCGTTTA GCGCAAACGG CAATAAAGTC AACATcACAA

351 GCGACACCAA AGGCTTGAAT TTTGCGAAAG AAACGGCTGG sACGAACGgC

401 GACACCACGG TTCATCTGAA CGGTATTGGT TCGACTTTGA CCGATACGCT

451 GCTGAATACC GGAGCGACCA CAAACGTAAC CAACGACAAC GTTACCGATG

501 ACGAGAAAAA ACGTGCGGCA AGCGTTAAAG ACGTATTAAA CGCTGGCTGG

551 AACATTAAAG GCGTTAAACC CGGTACAACA GCTTCCGATA ACGTTGATTT

601 CGTCCGCACT TACGACACAG TCGAGTTCTT GAGCGCAGAT ACGAAAACAA

651 CGACTGTTAA TGTGGAAAGC AAAGACAACG GCAAGAAAAC CGAAGTTAAA

701 ATCGGTGCGA AGACTTCTGT TATTAAAGAA AAAGAC...

它对应于氨基酸序列<SEQ ID 2；ORF40>：

1 ..TLLFATVQAS ANQEEQEEDL YLDPVQRTVA VLIVNSDKEG TGEKEKVEEN

51 SDWAVYFNEK GVLTAREITX KAGDNLKIKQ NGTNFTYSLK KDLTDLTSVG

101 TEKLSFSANG NKVNITSDTK GLNFAKETAG TNGDTTVHLN GIGSTLTDTL

151 LNTGATTNVT NDNVTDDEKK RAASVKDVLN AGWNIKGVKP GTTASDNVDF

201 VRTYDTVEFL SADTKTTTVN VESKDNGKKT EVKIGAKTSV IKEKD...

进一步的工作揭示了完整的DNA序列<SEQ ID 3>：

1 ATGAACAAAA TATACCGCAT CATTTGGAAT AGTGCCCTCA ATGCCTGGGT

51 CGTCGTATCC GAGCTCACAC GCAACCACAC CAAACGCGCC TCCGCAACCG

101 TGAAGACCGC CGTATTGGCG ACACTGTTGT TTGCAACGGT TCAGGCAAGT

151 GCTAACAATG AAGAGCAAGA AGAAGATTTA TATTTAGACC CCGTACAACG

201 CACTGTTGCC GTGTTGATAG TCAATTCCGA TAAAGAAGGC ACGGGAGAAA

251 AAGAAAAAGT AGAAGAAAAT TCAGATTGGG CAGTATATTT CAACGAGAAA

301 GGAGTACTAA CAGCCAGAGA AATCACCCTC AAAGCCGGCG ACAACCTGAA

351 AATCAAACAA AACGGCACAA ACTTCACCTA CTCGCTGAAA AAAGACCTCA

401 CAGATCTGAC CAGTGTTGGA ACTGAAAAAT TATCGTTTAG CGCAAACGGC

451 AATAAAGTCA ACATCACAAG CGACACCAAA GGCTTGAATT TTGCGAAAGA

501 AACGGCTGGG ACGAACGGCG ACACCACGGT TCATCTGAAC GGTATTGGTT

551 CGACTTTGAC CGATACGCTG CTGAATACCG GAGCGACCAC AAACGTAACC

601 AACGACAACG TTACCGATGA CGAGAAAAAA CGTGCGGCAA GCGTTAAAGA

651 CGTATTAAAC GCTGGCTGGA ACATTAAAGG CGTTAAACCC GGTACAACAG

701 CTTCCGATAA CGTTGATTTC GTCCGCACTT ACGACACAGT CGAGTTCTTG

751 AGCGCAGATA CGAAAACAAC GACTGTTAAT GTGGAAAGCA AAGACAACGG

801 CAAGAAAACC GAAGTTAAAA TCGGTGCGAA GACTTCTGTT ATTAAAGAAA

851 AAGACGGTAA GTTGGTTACT GGTAAAGACA AAGGCGAGAA TGGTTCTTCT

901 ACAGACGAAG GCGAAGGCTT AGTGACTGCA AAAGAAGTGA TTGATGCAGT

951 AAACAAGGCT GGTTGGAGAA TGAAAACAAC AACCGCTAAT GGTCAAACAG

1001 GTCAAGCTGA CAAGTTTGAA ACCGTTACAT CAGGCACAAA TGTAACCTTT

1051 GCTAGTGGTA AAGGTACAAC TGCGACTGTA AGTAAAGATG ATCAAGGCAA

1101 CATCACTGTT ATGTATGATG TAAATGTCGG CGATGCCCTA AACGTCAATC

1151 AGCTGCAAAA CAGCGGTTGG AATTTGGATT CCAAAGCGGT TGCAGGTTCT

1201 TCGGGCAAAG TCATCAGCGG CAATGTTTCG CCGAGCAAGG GAAAGATGGA

1251 TGAAACCGTC AACATTAATG CCGGCAACAA CATCGAGATT ACCCGCAACG

1301 GTAAAAATAT CGACATCGCC ACTTCGATGA CCCCGCAGTT TTCCAGCGTT

1351 TCGCTCGGCG CGGGGGCGGA TGCGCCCACT TTGAGCGTGG ATGGGGACGC

1401 ATTGAATGTC GGCAGCAAGA AGGACAACAA ACCCGTCCGC ATTACCAATG

1451 TCGCCCCGGG CGTTAAAGAG GGGGATGTTA CAAACGTCGC ACAACTTAAA

1501 GGCGTGGCGC AAAACTTGAA CAACCGCATC GACAATGTGG ACGGCAACGC

1551 GCGTGCGGGC ATCGCCCAAG CGATTGCAAC CGCAGGTCTG GTTCAGGCGT

1601 ATTTGCCCGG CAAGAGTATG ATGGCGATCG GCGGCGGCAC TTATCGCGGC

1651 GAAGCCGGTT ACGCCATCGG CTACTCCAGT ATTTCCGACG GCGGAAATTG

1701 GATTATCAAA GGCACGGCTT CCGGCAATTC GCGCGGCCAT TTCGGTGCTT

1751 CCGCATCTGT CGGTTATCAG TGGTAA

它对应于氨基酸序列<SEQ ID 4；ORF40-1>：

1 MNKIYRIIWN SALNAWVVVS ELTRNHTKRA SATVKTAVLA TLLFATVQAS

51 ANNEEQEEDL YLDPVQRTVA VLIVNSDKEG TGEKEKVEEN SDWAVYFNEK

101 GVLTAREIrL KAGDNLKIKQ NGTNFTYSLK KDLTDLTSVG TEKLSFSANG

151 NKVNITSDTK GLNFAKETAG TNGDTTVHLN GIGSTLTDTL LNTGATTNVT

201 NDNVTDDEKK RAASVKDVLN AGWNIKGVKP GTTASDNVDF VRTYDTVEFL

251 SADTKTTTVN VESKDNGKKT EVKIGAKTSV IKEKDGKLVT GKDKGENGSS

301 TDEGEGLVTA KEVIDAVNKA GWRMKTTTAN GQTGQADKFE TVTSGTNVTF

351 ASGKGTTATV SKDDQGNITV MYDVNVGDAL NVNQLQNSGW NLDSKAVAGS

401 SGKVISGNVS PSKGKMDETV NINAGNNIEI TRNGKNIDIA TSMTPQFSSV

451 SLGAGADAPT LSVDGDALNV GSKKDNKPVR ITNVAPGVKE GDVTNVAQLK

501 GVAQNLNNRI DNVDGNARAG IAQAIATAGL VQAYLPGKSM MAIGGGTYRG

551 EAGYAIGYSS ISDGGNWIIK GTASGNSRGH FGASASVGYQ W*

进一步的工作鉴定了脑膜炎奈瑟氏球菌菌株A中对应的基因<SEQ ID 5>：

1 ATGAACAAAA TATACCGCAT CATTTGGAAT AGTGCCCTCA ATGCCTGNGT

51 CGCCGTATCC GAGCTCACAC GCAACCACAC CAAACGCGCC TCCGCAACCG

101 TGAAGACCGC CGTATTGGCG ACACTGTTGT TTGCAACGGT TCAGGCGAAT

151 GCTACCGATG AAGATGAAGA AGAAGAGTTA GAATCCGTAC AACGCTCTGT

201 CGTAGGGAGC ATTCAAGCCA GTATGGAAGG CAGCGGCGAA TTGGAAACGA

251 TATCATTATC AATGACTAAC GACAGCAAGG AATTTGTAGA CCCATACATA

301 GTAGTTACCC TCAAAGCCGG CGACAACCTG AAAATCAAAC AAAACACCAA

351 TGAAAACACC AATGCCAGTA GCTTCACCTA CTCGCTGAAA AAAGACCTCA

401 CAGGCCTGAT CAATGTTGAN ACTGAAAAAT TATCGTTTGG CGCAAACGGC

451 AAGAAAGTCA ACATCATAAG CGACACCAAA GGCTTGAATT TCGCGAAAGA

501 AACGGCTGGG ACGAACGGCG ACACCACGGT TCATCTGAAC GGTATCGGTT

551 CGACTTTGAC CGATACGCTT GCGGGTTCTT CTGCTTCTCA CGTTGATGCG

601 GGTAACCNAA GTACACATTA CACTCGTGCA GCAAGTATTA AGGATGTGTT

651 GAATGCGGGT TGGAATATTA AGGGTGTTAA ANNNGGCTCA ACAACTGGTC

701 AATCAGAAAA TGTCGATTTC GTCCGCACTT ACGACACAGT CGAGTTCTTG

751 AGCGCAGATA CGNAAACAAC GACNGTTAAT GTGGAAAGCA AAGACAACGG

801 CAAGAGAACC GAAGTTAAAA TCGGTGCGAA GACTTCTGTT ATTAAAGAAA

851 AAGACGGTAA GTTGGTTACT GGTAAAGGCA AAGGCGAGAA TGGTTCTTCT

901 ACAGACGAAG GCGAAGGCTT AGTGACTGCA AAAGAAGTGA TTGATGCAGT

951 AAACAAGGCT GGTTGGAGAA TGAAAACAAC AACCGCTAAT GGTCAAACAG

1001 GTCAAGCTGA CAAGTTTGAA ACCGTTACAT CAGGCACAAA TGTAACCTTT

1051 GCTAGTGGTA AAGGTACAAC TGCGACTGTA AGTAAAGATG ATCAAGGCAA

1101 CATCACTGTT ATGTATGATG TAAATGTCGG CGATGCCCTA AACGTCAATC

1151 AGCTGCAAAA CAGCGGTTGG AATTTGGATT CCAAAGCGGT TGCAGGTTCT

1201 TCGGGCAAAG TCATCAGCGG CAATGTTTCG CCGAGCAAGG GAAAGATGGA

1251 TGAAACCGTC AACATTAATG CCGGCAACAA CATCGAGATT AGCCGCAACG

1301 GTAAAAATAT CGACATCGCC ACTTCGATGG CGCCGCAGTT TTCCAGCGTT

1351 TCGCTCGGCG CGGGGGCAGA TGCGCCCACT TTAAGCGTGG ATGACGAGGG

1401 CGCGTTGAAT GTCGGCAGCA AGGATGCCAA CAAACCCGTC CGCATTACCA

1451 ATGTCGCCCC GGGCGTTAAA GANGGGGATG TTACAAACGT CNCACAACTT

1501 AAAGGCGTGG CGCAAAACTT GAACAACCGC ATCGACAATG TGGACGGCAA

1551 CGCGCGTGCN GGCATCGCCC AAGCGATTGC AACCGCAGGT CTGGTTCAGG

1601 CGTATCTGCC CGGCAAGAGT ATGATGGCGA TCGGCGGCGG CACTTATCGC

1651 GGCGAAGCCG GTTACGCCAT CGGCTACTCC AGTATTTCCG ACGGCGGAAA

1701 TTGGATTATC AAAGGCACGG CTTCCGGCAA TTCGCGCGGC CATTTCGGTG

1751 CTTCCGCATC TGTCGGTTAT CAGTGGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 6；ORF40a>：

1 MNKIYRIIWN SALNAXVAVS ELTRNHTKRA SATVKTAVLA TLLFATVQAN

51 ATDEDEEEEL ESVQRSVVGS IQASMEGSGE LETISLSMTN DSKEFVDPYI

101 VVTLKAGDNL KIKQNTNENT NASSFTYSLK KDLTGLINVX TEKLSFGANG

151 KKVNIISDTK GLNFAKETAG TNGDTTVHLN GIGSTLTDTL AGSSASHVDA

201 GNXSTHYTRA ASIKDVLNAG WNIKGVKXGS TTGQSENVDF VRTYDTVEFL

251 SADTXTTTVN VESKDNGKRT EVKIGAKTSV IKEKDGKLVT GKGKGENGSS

301 TDEGEGLVTA KEVIDAVNKA GWRMKTTTAN GQTGQADKFE TVTSGTNVTF

351 ASGKGTTATV SKDDQGNITV MYDVNVGDAL NVNQLQNSGW NLDSKAVAGS

401 SGKVISGNVS PSKGKMDETV NINAGNNIEI SRNGKNIDIA TSMAPQFSSV

451 SLGAGADAPT LSVDDEGALN VGSKDANKPV RITNVAPGVK XGDVTNVXQL

501 KGVAQNLNNR IDNVDGNARA GIAQAIATAG LVQAYLPGKS MMAIGGGTYR

551 GEAGYAIGYS SISDGGNNII KGTASGNSRG HFGASASVGY QW*

最初鉴定的部分菌株B序列(ORF40)显示在与ORF40a重叠的254个氨基酸内有65.7％的相同性：

10 20 30

orf40.pep TLLFATVQASANQEEQEEDLYLDPVQRTVA

|||||||||:|::|::||:| : |||:|

orf40a SALNAXVAVSELTRNHTKRASATVKTAVLATLLFATVQANATDEDEEEEL--ESVQRSV-

20 30 40 50 60

40 50 60 70 80

orf40.pep VLIVNSDKEGTGEKEKVEEN-SDWAVYFNEKGVLTAREITXKAGDNLKIKQN------GT

| :::: ||:|| | : : :: : | : :: :| ||||||||||| ::

orf40a VGSIQASMEGSGELETISLSMTNDSKEFVDPYIV----VTLKAGDNLKIKQNTNENTNAS

70 80 90 100 110 120

90 100 110 120 130 140

orf40.pep NFTYSLKKDLTDLTSVGTEKLSFSANGNKVNITSDTKGLNFAKETAGTNGDTTVHLNGIG

:|||||||||| | :| ||||||:|||:|||| |||||||||||||||||||||||||||

orf40a SFTYSLKKDLTGLINVXTEKLSFGANGKKVNIISDTKGLNFAKETAGTNGDTTVHLNGIG

130 140 150 160 170 180

150 160 170 180 190 200

orf40.pep STLTDTLLNTGATTNVTNDNVTDDEKKRAASVKDVLNAGWNIKGVKPGTTA--SDNVDFV

||||||| :::|: :| | : :||||:|||||||||||||||| :|:| |:|||||

orf40a STLTDTLAGSSAS-HVDAGNXST-HYTRAASIKDVLNAGWNIKGVKXGSTTGQSENVDFV

190 200 210 220 230 240

210 220 230 240

orf40.pep RTYDTVEFLSADTKTTTVNVESKDNGKKTEVKIGAKTSVIKEKD

||||||||||||| |||||||||||||:||||||||||||||||

orf40a RTYDTVEFLSADTXTTTVNVESKDNGKRTEVKIGAKTSVIKEKDGKLVTGKGKGENGSST

250 260 270 280 290 300

完整的菌株B序列(ORF40-1)和ORF40a显示在601个重叠的氨基酸内有83.7％的相同性：

10 20 30 40 50 60

orf40-1.pep MNKIYRIIWNSALNAWVVVSELTRNHTKRASATVKTAVLATLLFATVQASANNEEQEEDL

||||||||||||||| |:|||||||||||||||||||||||||||||||:|::|::||:|

orf40a MNKIYRIIWNSALNAXVAVSELTRNHTKRASATVKTAVLATLLFATVQANATDEDEEEEL

10 20 30 40 50 60

70 80 90 100 110 119

orf40-1.pep YLDPVQRTVAVLIVNSDKEGTGEKEKVEEN-SDWAVYFNEKGVLTAREITLKAGDNLKIK

: |||:| | :::: ||:|| | : : :: : | : :: :|||||||||||

orf40a --ESVQRSV-VGSIQASMEGSGELETISLSMTNDSKEFVDPYIV----VTLKAGDNLKIK

70 80 90 100 110

120 130 140 150 160 170

orf40-1.pep QN------GTNFTYSLKKDLTDLTSVGTEKLSFSANGNKVNITSDTKGLNFAKETAGTNG

|| :::|||||||||| |: | ||||||:|||:|||| |||||||||||||||||

orf40a QNTNENTNASSFTYSLKKDLTGLINVXTEKLSFGANGKKVNIISDTKGLNFAKETAGTNG

120 130 140 150 160 170

180 190 200 210 220 230

orf40-1.pep DTTVHLNGIGSTLTDTLLNTGATTNVTNDNVTDDEKKRAASVKDVLNAGWNIKGVKPGTT

||||||||||||||||| :::|: :| |: :||||:|||||||||||||||| |:|

orf40a DTTVHLNGIGSTLTDTLAGSSAS-HVDAGNXST-HYTRAASIKDVLNAGWNIKGVKXGST

180 190 200 210 220 230

240 250 260 270 280 290

orf40-1.pep A--SDNVDFVRTYDTVEFLSADTKTTTVNVESKDNGKKTEVKIGAKTSVIKEKDGKLVTG

: |:|||||||||||||||||| |||||||||||||:||||||||||||||||||||||

orf40a TGQSENVDFVRTYDTVEFLSADTXTTTVNVESKDNGKRTEVKIGAKTSVIKEKDGKLVTG

240 250 260 270 280 290

300 310 320 330 340 350

orf40-1.pep KDKGENGSSTDEGEGLVTAKEVIDAVNKAGWRMKTTTANGQTGQADKFETVTSGTNVTFA

| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf40a KGKGENGSSTDEGEGLVTAKEVIDAVNKAGWRMKTTTANGQTGQADKFETVTSGTNVTFA

300 310 320 330 340 350

360 370 380 390 400 410

orf40-1.pep SGKGTTATVSKDDQGNITVMYDVNVGDALNVNQLQNSGWNLDSKAVAGSSGKVISGNVSP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf40a SGKGTTATVSKDDQGNITVMYDVNVGDALNVNQLQNSGWNLDSKAVAGSSGKVISGNVSP

360 370 380 390 400 410

420 430 440 450 460 470

orf40-1.pep SKGKMDETVNINAGNNIEITRNGKNIDIATSMTPQFSSVSLGAGADAPTLSVDGD-ALNV

|||||||||||||||||||:|||||||||||:||||||||||||||||||||| : ||||

orf40a SKGKMDETVNINAGNNIEISRNGKNIDIATSMAPQFSSVSLGAGADAPTLSVDDEGALNV

420 430 440 450 460 470

480 490 500 510 520 530

orf40-1.pep GSKKDNKPVRITNVAPGVKEGDVTNVAQLKGVAQNLNNRIDNVDGNARAGIAQAIATAGL

||| |||||||||||||| |||||| |||||||||||||||||||||||||||||||||

orf40a GSKDANKPVRITNVAPGVKXGDVTNVXQLKGVAQNLNNRIDNVDGNARAGIAQAIATAGL

480 490 500 510 520 530

540 550 560 570 580 590

orf40-1.pep VQAYLPGKSMMAIGGGTYRGEAGYAIGYSSISDGGNWIIKGTASGNSRGHFGASASVGYQ

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf40a VQAYLPGKSMMAIGGGTYRGEAGYAIGYSSISDGGNWIIKGTASGNSRGHFGASASVGYQ

540 550 560 570 580 590

orf40-1.pep WX

||

orf40a WX

这些氨基酸序列的计算机分析给出了下列结果：

与流感嗜血菌的b型表面原纤维基因座编码的Hsf蛋白(登录号U41852)的同源性

ORF40和Hsf蛋白显示在251个重叠的氨基酸内有54％的氨基酸相同性：

0rf40 1 TLLFATVQASANQEEQEEDLYLDPVQRTVAVLIVNSDXXXXXXXXXXXXNSDWAVYFNEK 60

TLLFATVQA+A E++E LDPV RT VL +SD NS+W +YF +K

Hsf 41 TLLFATVQANATDEDEE----LDPVVRTAPVLSFHSDKEGTGEKEVTE-NSNWGIYFDNK 95

0rf40 61 GVLTAREITXKAGDNLKIKQN------GTNFTYSLKKDLTDLTSVGTEKLSFSANGNKVN 114

GVL A IT KAGDNLKIKQN ++FTYSLKKDLTDLTSV TEKLSF ANG+KV+

Hsf 96 GVLKAGAITLKAGDNLKIKQNTDESTNASSFTYSLKKDLTDLTSVATEKLSFGANGDKVD 155

0rf40 115 ITSDTKGLNFAKETAGTNGDTTVHLNGIGSTLTDTLLNTGAXXXXXXXXXXXXEKKRAAS 174

ITSD GL AK G+ VHLNG+ STL D + NTG EK RAA+

Hsf 156 ITSDANGLKLAK-----TGNGNVHLNGLDSTLPDAVTNTGVLSSSSFTPNDV-EKTRAAT 209

0rf40 175 VKDVLNAGWNIKGVKPGTTASDNVDFVRTYDTVEFLSADTKTTTVNVESKDNGKKTEVKI 234

VKDVLNAGWNIKG K ++VD V Y+ VEF++ D T V + +K+NGK TEVK

Hsf 210 VKDVLNAGWNIKGAKTAGGNVESVDLVSAYNNVEFITGDKNTLDVVLTAKENGKTTEVKF 269

0rf40 235 GAKTSVIKEKD 245

KTSVIKEKD

Hsf 270 TPKTSVIKEKD 280

ORF40a还显示与Hsf同源：

gi|1666683(U41852)hsf基因产物[流感嗜血菌]长度＝2353

评分＝153(67.7bits)，预计＝1.5e-116，Sum P(11)＝1.5e-116

相同性＝33/36(91％)，阳性＝34/36(94％)

询问： 16 VAVSELTRNHTKRASATVKTAVLATLLFATVQANAT 51

V VSELTR HTKRASATV+TAVLATLLFATVQANAT

目标： 17 VVVSELTRTHTKRASATVETAVLATLLFATVQANAT 52

评分＝161(71.2bits)，预计＝1.5e-116，SumP(11)＝1.5e-116

相同性＝32/38(84％)，阳性＝36/38(94％)

询问：101 VTLKAGDNLKIKQNTNENTNASSFTYSLKKDLTGLINV 138

+TLKAGDNLKIKQNT+E+TNASSFTYSLKKDLT L+V

目标：103 ITLKAGDNLKIKQNTDESTNASSFTYSLKKDLTDLTSV 140

评分＝110(48.7bits)，预计＝1.5e-116，Sum P(11)＝1.5e-116

相同性＝21/29(72％)，阳性＝25/29(86％)

询问：138 VTEKLSFGANGKKVNIISDTKGLNFAKET 166

V++KLS G NG KVNI SDTKGLNFAK++

目标：1439 VSDKLSLGTNGNKVNITSDTKGLNFAKDS 1467

评分＝85(37.6bits)，预计＝1.5e-116，Sum P(11)＝1.5e-116

相同性＝18/32(56％)，阳性＝20/32(62％)

询问：169 TNGDTTVHLNGIGSTLTDTLAGSSASHVDAGN 200

T D +HLNGI STLTDTL S A+ GN

目标：1469 TGDDANIHLNGIASTLTDTLLNSGATTNLGGN 1500

评分＝92(40.7bits)，预计＝1.5e-116，Sum P(11)＝1.5e-116

相同性＝16/19(84％)，阳性＝19/19(100％)

询问：206 RAASIKDVLNAGWNIKGVK 224

RAAS+KDVLNAGWN++GVK

目标：1509 RAASVKDVLNAGWNVRGVK 1527

评分＝90(39.8bits)，预计＝1.5e-116，Sum P(11)＝1.5e-116

相同性＝17/28(60％)，阳性＝20/28(71％)

询问：226 STTGQSENVDFVRTYDTVEFLSADTTTT 253

S Q EN+DFV TYDTV+F+S D TT

目标：1530 SANNQVENIDFVATYDTVDFVSGDKDTT 1557

根据与Hsf的同源性，预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。

如上所述，将ORF40-1(61kDa)克隆到pET和pGex载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图1A显示了His-融合蛋白的亲和纯化结果，图1B显示了GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠，用该小鼠的血清进行FACS分析(图1C)，杀菌试验(图1D)和ELISA(阳性结果)。这些实验确认ORF40-1是一种表面外露蛋白，且是一种有用的免疫原。

图1E显示了ORF40-1的亲水性曲线、抗原性指数和AMPHI区域。

实施例2

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 7>

1 ATGTTACGTt TGACTGCtTT AGCCGTATGC ACCGCCCTCG CTTTGGGCGC

51 GTGTTCGCCG CAAAATTCCG ACTCTGCCCC ACAAGCCAAA GaACAGGCGG

101 TTTCCGCCGC ACAAACCGAA GgCGCGTCCG TTACCGTCAA AACCGCGCGC

151 GGCGACGTTC AAATACCGCA AAACCCCGAA CGCATCGCCG TTTACGATTT

201 GGGTATGCTC GACACCTTGA GCAAACTGGG CGTGAAAACC GGTTTGTCCG

251 TCGATAAAAA CCGCCTGCCG TATTTAGAGG AATATTTCAA AACGACAAAA

301 CCTGCCGGCA CTTTGTTCGA GCCGGATTAC GAAACGCTCA ACGCTTACAA

351 ACCGCAGCTC ATCATCATCG GCAGCCGCGC CgCCAAGGCG TTTGACAAAT

401 TGAAcGAAAT CGCGCCGACC ATCGrmwTGA CCGCCGATAC CGCCAACCTC

451 AAAGAAAGTG CCAArGAGGC ATCGACGCTG GCGCAAATCT TC..

它对应于氨基酸序列<SEQ ID 8；ORF38>：

1 MLRLTAL AVC TALALGACSP QNSDSAPQAK EQAVSAAQTE GASVTVKTAR

51 GDVQIPQNPE RIAVYDLGML DTLSKLGVKT GLSVDKNRLP YLEEYFKTTK

101 PAGTLFEPDY ETLNAYKPQL IIIGSRAAKA FDKLNEIAPT IXXTADTANL

151 KESAKEASTL AQIF..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 9>：

1 ATGTTACGTT TGACTGCTTT AGCCGTATGC ACCGCCCTCG CTTTGGGCGC

51 GTGTTCGCCG CAAAATTCCG ACTCTGCCCC ACAAGCCAAA GAACAGGCGG

101 TTTCCGCCGC ACAAACCGAA GGCGCGTCCG TTACCGTCAA AACCGCGCGC

151 GGCGACGTTC AAATACCGCA AAACCCCGAA CGCATCGCCG TTTACGATTT

201 GGGTATGCTC GACACCTTGA GCAAACTGGG CGTGAAAACC GGTTTGTCCG

251 TCGATAAAAA CCGCCTGCCG TATTTAGAGG AATATTTCAA AACGACAAAA

301 CCTGCCGGCA CTTTGTTCGA GCCGGATTAC GAAACGCTCA ACGCTTACAA

351 ACCGCAGCTC ATCATCATCG GCAGCCGCGC CGCCAAGGCG TTTGACAAAT

401 TGAACGAAAT CGCGCCGACC ATCGAAATGA CCGCCGATAC CGCCAACCTC

451 AAAGAAAGTG CCAAAGAGCG CATCGACGCG CTGGCGCAAA TCTTCGGCAA

501 ACAGGCGGAA GCCGACAAGC TGAAGGCGGA AATCGACGCG TCTTTTGAAG

551 CCGCGAAAAC TGCCGCACAA GGTAAGGGCA AAGGTTTGGT GATTTTGGTC

601 AACGGCGGCA AGATGTCGGC TTTCGGCCCG TCTTCACGCT TGGGCGGCTG

651 GCTGCACAAA GACATCGGCG TTCCCGCTGT CGATGAATCA ATTAAAGAAG

701 GCAGCCACGG TCAGCCTATC AGCTTTGAAT ACCTGAAAGA GAAAAATCCC

751 GACTGGCTGT TTGTCCTTGA CCGAAGCGCG GCCATCGGCG AAGAGGGTCA

801 GGCGGCGAAA GACGTGTTGG ATAATCCGCT GGTTGCCGAA ACAACCGCTT

851 GGAAAAAAGG ACAGGTCGTG TACCTCGTTC CTGAAACTTA TTTGGCAGCC

901 GGTGGCGCGC AAGAGCTGCT GAATGCAAGC AAACAGGTTG CCGACGCTTT

951 TAACGCGGCA AAATAA

它对应于氨基酸序列<SEQ ID 10；ORF38-1>：

1 MLRLTALAVC TALALGACSP QNSDSAPQAK EQAVSAAQTE GASVTVKTAR

51 GDVQIPQNPE RIAVYDLGML DTLSKLGVKT GLSVDKNRLP YLEEYFKTTK

101 PAGTLFEPDY ETLNAYKPQL IIIGSRAAKA FDKLNEIAPT IEMTADTANL

151 KESAKERIDA LAQIFGKQAE ADKLKAEIDA SFEAAKTAAQ GKGKGLVILV

201 NGGKMSAFGP SSRLGGWLHK DIGVPAVDES IKEGSHGQPI SFEYLKEKNP

251 DWLFVLDRSA AIGEEGQAAK DVLDNPLVAE TTAWKKGQVV YLVPETYLAA

301 GGAQELLNAS KQVADAFNAA K*

该氨基酸序列的计算机分析揭示了一个推定的原核细胞膜脂蛋白脂质连接位点(下划线)。

进一步的工作鉴定了脑膜炎奈瑟氏球菌菌株A中对应的基因<SEQ ID 11>：

1 ATGTTACGTT TGACTGCTTT AGCCGTATGC ACCGCCCTCG CTTTGGGCGC

51 GTGTTCGCCG CAAAATTCCG ACTCTGCCCC ACAAGCCAAA GAACAGGCGG

101 TTTCCGCCGC ACAATCCGAA GGCGTGTCCG TTACCGTCAA AACGGCGCGC

151 GGCGATGTTC AAATACCGCA AAACCCCGAA CGTATCGCCG TTTACGATTT

201 GGGTATGCTC GACACCTTGA GCAAACTGGG CGTGAAAACC GGTTTGTCCG

251 TCGATAAAAA CCGCCTGCCG TATTTAGAGG AATATTTCAA AACGACAAAA

301 CCTGCCGGAA CTTTGTTCGA GCCGGATTAC GAAACGCTCA ACGCTTACAA

351 ACCGCAGCTC ATCATCATCG GCAGCCGCGC AGCCAAAGCG TTTGACAAAT

401 TGAACGAAAT CGCGCCGACC ATCGAAATGA CCGCCGATAC CGCCAACCTC

451 AAAGAAAGTG CCAAAGAGCG TATCGACGCG CTGGCGCAAA TCTTCGGCAA

501 AAAGGCGGAA GCCGACAAGC TGAAGGCGGA AATCGACGCG TCTTTTGAAG

551 CCGCGAAAAC TGCCGCGCAA GGCAAAGGCA AGGGTTTGGT GATTTTGGTC

601 AACGGCGGCA AGATGTCCGC CTTCGGCCCG TCTTCACGAC TGGGCGGCTG

651 GCTGCACAAA GACATCGGCG TTCCCGCTGT TGACGAAGCC ATCAAAGAAG

701 GCAGCCACGG TCAGCCTATC AGCTTTGAAT ACCTGAAAGA GAAAAATCCC

751 GACTGGCTGT TTGTCCTTGA CCGCAGCGCG GCCATCGGCG AAGAGGGTCA

801 GGCGGCGAAA GACGTGTTGA ACAATCCGCT GGTTGCCGAA ACAACCGCTT

851 GGAAAAAAGG ACAAGTCGTT TACCTTGTTC CTGAAACTTA TTTGGCAGCC

901 GGTGGCGCGC AAGAGCTACT GAATGCAAGC AAACAGGTTG CCGACGCTTT

951 TAACGCGGCA AAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 12；ORF38a>：

1 MLRLTALAVC TALALGACSP QNSDSAPQAK EQAVSAAQSE GVSVTVKTAR

51 GDVQIPQNPE RIAVYDLGML DTLSKLGVKT GLSVDKNRLP YLEEYFKTTK

101 PAGTLFEPDY ETLNAYKPQL IIIGSRAAKA FDKLNEIAPT IEMTADTANL

151 KESAKERIDA LAQIFGKKAE ADKLKAEIDA SFEAAKTAAQ GKGKGLVILV

201 NGGKMSAFGP SSRLGGWLHK DIGVPAVDEA IKEGSHGQPI SFEYLKEKNP

251 DWLFVLDRSA AIGEEGQAAK DVLNNPLVAE TTAWKKGQVV YLVPETYLAA

301 GGAQELLNAS KQVADAFNAA K*

最初鉴定的部分菌株B序列(ORF38)显示在和ORF38a重叠的165个氨基酸内有95.2％的相同性：

10 20 30 40 50 60

orf38.pep MLRLTALAVCTALALGACSPQNSDSAPQAKEQAVSAAQTEGASVTVKTARGDVQIPQNPE

|||||||||||||||||| ||||||||||||||||||||:||:||||||||||||||||||

orf38a MLRLTALAVCTALALGACSPQNSDSAPQAKEQAVSAAQSEGVSVTVKTARGDVQIPQNPE

10 20 30 40 50 60

70 80 90 100 110 120

orf38.pep RIAVYDLGMLDTLSKLGVKTGLSVDKNRLPYLEEYFKTTKPAGTLFEPDYETLNAYKPQL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf38a RIAVYDLGMLDTLSKLGVKTGLSVDKNRLPYLEEYFKTTKPAGTLFEPDYETLNAYKPQL

70 80 90 100 110 120

130 140 150 160

orf38.pep IIIGSRAAKAFDKLNEIAPTIXXTADTANLKESAKE-ASTLAQIF

||||||||||||||||||||| ||||||||||||| ::|||||

orf38a IIIGSRAAKAFDKLNEIAPTIEMTADTANLKESAKERIDALAQIFGKKAEADKLKAEIDA

130 140 150 160 170 180

orf38a SFEAAKTAAQGKGKGLVILVNGGKMSAFGPSSRLGGWLHKDIGVPAVDEAIKEGSHGQPI

190 200 210 220 230 240

完整的菌株B序列(ORF38-1)和ORF38a显示在321个重叠的氨基酸内有98.4％的相同性：

orf38a.pep MLRLTALAVCTALALGACSPQNSDSAPQAKEQAVSAAQSEGVSVTVKTARGDVQIPQNPE

||||||||||||||||||||||||||||||||||||||:||:||||||||||||||||||

orf38-1 MLRLTALAVCTALALGACSPQNSDSAPQAKEQAVSAAQTEGASVTVKTARGDVQIPQNPE

orf38a.pep RIAVYDLGMLDTLSKLGVKTGLSVDKNRLPYLEEYFKTTKPAGTLFEPDYETLNAYKPQL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf38-1 RIAVYDLGMLDTLSKLGVKTGLSVDKNRLPYLEEYFKTTKPAGTLFEPDYETLNAYKPQL

orf38a.pep IIIGSRAAKAFDKLNEIAPTIEMTADTANLKESAKERIDALAQIFGKKAEADKLKAEIDA

|||||||||||||||||||||||||||||||||||||||||||||||:||||||||||||

orf38-1 IIIGSRAAKAFDKLNEIAPTIEMTADTANLKESAKERIDALAQIFGKQAEADKLKAEIDA

orf38a.pep SFEAAKTAAQGKGKGLVILVNGGKMSAFGPSSRLGGWLHKDIGVPAVDEAIKEGSHGQPI

|||||||||||||||||||||||||||||||||||||||||||||||||:||||||||||

orf38-1 SFEAAKTAAQGKGKGLVILVNGGKMSAFGPSSRLGGWLHKDIGVPAVDESIKEGSHGQPI

orf38a.pep SFEYLKEKNPDWLFVLDRSAAIGEEGQAAKDVLNNPLVAETTAWKKGQVVYLVPETYLAA

|||||||||||||||||||||||||||||||||:||||||||||||||||||||||||||

orf38-1 SFEYLKEKNPDWLFVLDRSAAIGEEGQAAKDVLDNPLVAETTAWKKGQVVYLVPETYLAA

orf38a.pep GGAQELLNASKQVADAFNAAK

|||||||||||||||||||||

orf38-1 GGAQELLNASKQVADAFNAAK

这些序列的计算机分析揭示了下列结果：

与C.jejuni的脂蛋白(lipo)(登录号X82427)的同源性

ORF38和lipo显示在96个重叠的氨基酸内有38％的氨基酸相同性：

0rf38：40 EGASVTVKTARGDVQIPQNPERIAVYDLGMLDTLSKLGVKTGLS-VDKNRLPYLEEYFKT 98

EG S VK + G+ + P+NP ++ + DLG+LDT L + ++ V LP + FK

Lipo：51 EGDSFLVKDSLGENKTPKNPSKVVILDLGILDTFDALKLNDKVAGVPAKNLPKYLQQFKN 110

0rf38：99 TKPAGTLFEPDYETLNAYKPQLIIIGSRAAKAFDKL 134

G + + D+E +NA KP LIII R +K +DKL

Lipo：111 KPSVGGVQQVDFEAINALKPDLIIISGRQSKFYDKL 146

根据该分析，预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。

如上所述，将ORF38-1(32kDa)克隆到pET和pGex载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图2A显示了His-融合蛋白的亲和纯化结果，图2B显示了GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠，将该小鼠的血清用于Western印迹分析(图2C)和FACS分析(图2D)。这些实验确认ORF38-1是一种表面外露蛋白，且是一种有用的免疫原。

图2E显示了ORF38-1的亲水性曲线、抗原性指数和AMPHI区域。

实施例3

鉴定出下列脑膜炎奈瑟氏球菌的DNA序列<SEQ ID 13>：

1 ATGAAACTTC TGACCACCGC AATCCTGTCT TCCGCAATCG CGCTCAGCAG

51 TATGGCTGCC GCCGCTGGCA CGGACAACCC CACTGTTGCA AAAAAAACCG

101 TCAGCTACGT CTGCCAGCAA GGTAAAAAAG TCAAAGTAAC CTACGGCTTC

151 AACAAACAGG GTCTGACCAC ATACGCTTCC GCCGTCATCA ACGGCAAACG

201 CGTGCAAATG CCTGTCAATT TGGACAAATC CGACAATGTG GAAACATTCT

251 ACGGCAAAGA AGGCGGTTAT GTTTTGGGTA CCGGCGTGAT GGATGGCAAA

301 TCCTACCGCA AACAGCCCAT TATGATTACC GCACCTGACA ACCAAATCGT

351 CTTCAAAGAC TGTTCCCCAC GTTAA

它对应于氨基酸序列<SEQ ID 14；ORF44>：

1 MKLLTTAILS SAIALSSMAA AAGTDNPTVA KKTVSYVCQQ GKKVKVTYGF

51 NKQGLTTYAS AVINGKRVQM PVNLDKSDNV ETFYGKEGGY VLGTGVMDGK

101 SYRKQPIMIT APDNQIVFKD CSPR*

该氨基酸序列的计算机分析预计了下划线所示的前导肽。

进一步的工作鉴定了脑膜炎奈瑟氏球菌菌株A中对应的基因<SEQ ID 15>：

1 ATGAAACTTC TGACCACCGC AATCCTGTCT TCCGCAATCG CGCTCAGCAG

51 TATGGCTGCT GCTGCCGGCA CGAACAACCC CACCGTTGCC AAAAAAACCG

101 TCAGCTACGT CTGCCAGCAA GGTAAAAAAG TCAAAGTAAC CTACGGCTTT

151 AACAAACAGG GCCTGACCAC ATACGCTTCC GCCGTCATCA ACGGCAAACG

201 TGTGCAAATG CCTGTCAATT TGGACAAATC CGACAATGTG GAAACATTCT

251 ACGGCAAAGA AGGCGGTTAT GTTTTGGGTA CCGGCGTGAT GGATGGCAAA

301 TCCTATCGCA AACAGCCTAT TATGATTACC GCACCTGACA ACCAAATCGT

351 CTTCAAAGAC TGTTCCCCAC GTTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 16；ORF44a>：

1 MKLLTTAILS SAIALSSMAA AAGTNNPTVA KKTVSYVCQQ GKKVKVTYGF

51 NKQGLTTYAS AVINGKRVQM PVNLDKSDNV ETFYGKEGGY VLGTGVMDGK

101 SYRKQPIMIT APDNQIVFKD CSPR*

菌株B序列(ORF44)显示在与ORF44a重叠的124个氨基酸内有99.2％的相同性：

10 20 30 40 50 60

orf44.pep MKLLTTAILSSAIALSSMAAAAGTDNPTVAKKTVSYVCQQGKKVKVTYGFNKQGLTTYAS

||||||||||||||||||| |||||:|||||||||||||||||||||||||||||||||||

orf44a MKLLTTAILSSAIALSSMAAAAGTNNPTVAKKTVSYVCQQGKKVKVTYGFNKQGLTTYAS

10 20 30 40 50 60

70 80 90 100 110 120

orf44.pep AVINGKRVQMPVNLDKSDNVETFYGKEGGYVLGTGVMDGKSYRKQPIMITAPDNQIVFKD

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf44a AVINGKRVQMPVNLDKSDNVETFYGKEGGYVLGTGVMDGKSYRKQPIMITAPDNQIVFKD

70 80 90 100 110 120

orf44.pep CSPRX

|||||

orf44a CSPRX

计算机分析给出下列结果：

与啮蚀拟杆菌(Eikenella corrodens)的LecA粘附素(登录号D78153)的同源性

ORF44和LecA蛋白显示在91个重叠的氨基酸内有45％的氨基酸相同性：

0rf44 33 TVSYVCQQGKKVKVTYGFNKQGLTTYASAVINGKRVQMPVNLDKSDNVETFYGKEGGYVL 92

+V+YVCQQG+++ V Y FN G+ T A +N + +++P NL SDNV+T + GY L

LecA 135 SVAYVCQQGRRLNVNYRFNSAGVPTSAELRVNNRNLRLPYNLSASDNVDTVF-SANGYRL 193

0rf44 93 GTGVMDGKSYRKQPIMITAPDNQIVFKDCSP 123

T MD +YR Q I+++AP+ Q+++KDCSP

LecA 194 TTNAMDSANYRSQDI IVSAPNGQMLYKDCSP 224

根据与该粘附素的同源性，预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。

如上所述，将ORF44-1(11.2kDa)克隆到pET和pGex载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图3A显示了His-融合蛋白的亲和纯化结果，图3B显示了GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠，用该小鼠的血清进行ELISA，给出阳性结果，并将该血清用于杀菌试验(图3C)。这些实验确认ORF44-1是一种表面外露蛋白，且是一种有用的免疫原。

图3D显示了ORF44-1的亲水性曲线、抗原性指数和AMPHI区域。

实施例4

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 17>

1 ..GGCACCGAAT TCAAAACCAC CCTTTCCGGA GCCGACATAC AGGCAGGGGT

51 GGGTGAAAAA GCCCGAGCCG ATGCGAAAAT TATCCTAAAA GGCATCGTTA

101 ACCGCATCCA AACCGAAGAA AAGCTGGAAT CCAACTCGAC CGTATGGCAA

151 AAGCAGGCCG GAAGCGGCAG CACGGTTGAA ACGCTGAAGC TACCGAGCTT

201 TGAAGGGCCG GCACTGCCTA AGCTGACCGC TCCCGGCGGC TATATCGCCG

251 ACATCCCCAA AGGCAACCTC AAAACCGAAA TCGAAAAGCT GGCCAAACAG

301 CCCGAATATG CCTATCTGAA ACAGCTTCAG ACGGTCAAGG ACGTGAACTG

351 GAACCAAGTA CAGCTCGCTT ACGACAAATG GGACTATAAA CAGGAAGGCC

401 TAACCGGAGC CGGAGCCGCA ATTANCGCAC TGGCCGTTAC CGTGGTCACC

451 TCAGGCGCAG GAACCGGAGC CGTATTGGGA TTAANACGNG TGGCCGCCGC

501 CGCAACCGAT GCAGCATTT...

它对应于氨基酸序列<SEQ ID 18；ORF49>：

1 ..GTEFKTTLSG ADIQAGVGEK ARADAKIILK GIVNRIQTEE KLESNSTVWQ

51 KQAGSGSTVE TLKLPSFEGP ALPKLTAPGG YIADIPKGNL KTEIEKLAKQ

101 PEYAYLKQLQ TVKDVNWNQV QLAYDKWDYK QE GLTGAGAA IXALAVTVVT

151 SGAGTGAVLG LXRVAAAATD AAF..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 19>：

1 ATGCAACTGC TGGCAGCCGA AGGCATTCAC CAACACCAAT TGAATGTTCA

51 GAAAAGTACC CGTTTCATCG GCATCAAAGT GGGTAAAAGC AATTACAGCA

101 AAAACGAGCT GAACGAAACC AAACTGCCCG TACGCGTTAT CGCCCAAACA

151 GCCAAAACCC GTTCCGGCTG GGATACCGTA CTCGAAGGCA CCGAATTCAA

201 AACCACCCTT TCCGGAGCCG ACATACAGGC AGGGGTGGGT GAAAAAGCCC

251 GAGCCGATGC GAAAATTATC CTAAAAGGCA TCGTTAACCG CATCCAAACC

301 GAAGAAAAGC TGGAATCCAA CTCGACCGTA TGGCAAAAGC AGGCCGGAAG

351 CGGCAGCACG GTTGAAACGC TGAAGCTACC GAGCTTTGAA GGGCCGGCAC

401 TGCCTAAGCT GACCGCTCCC GGCGGCTATA TCGCCGACAT CCCCAAAGGC

451 AACCTCAAAA CCGAAATCGA AAAGCTGGCC AAACAGCCCG AATATGCCTA

501 TCTGAAACAG CTTCAGACGG TCAAGGACGT GAACTGGAAC CAAGTACAGC

551 TCGCTTACGA CAAATGGGAC TATAAACAGG AAGGCCTAAC CGGAGCCGGA

601 GCCGCAATTA TCGCACTGGC CGTTACCGTG GTCACCTCAG GCGCAGGAAC

651 CGGAGCCGTA TTGGGATTAA ACGGTGCGGC CGCCGCCGCA ACCGATGCAG

701 CATTTGCCTC TTTGGCCAGC CAGGCTTCCG TATCGTTCAT CAACAACAAA

751 GGCAATATCG GTAACACCCT GAAAGAGCTG GGCAGAAGCA GCACGGTGAA

801 AAATCTGATG GTTGCCGTCG CTACCGCAGG CGTAGCCGAC AAAATCGGTG

851 CTTCGGCACT GAACAATGTC AGCGATAAGC AGTGGATCAA CAACCTGACC

901 GTCAACCTGG CCAATGCGGG CAGTGCCGCA CTGATTAATA CCGCTGTCAA

951 CGGCGGCAGC CTGAAAGACA ATCTGGAAGC GAATATCCTT GCGGCTTTGG

1001 TGAATACTGC GCATGGAGAG GCAGCAAGTA AAATCAAACA GTTGGATCAG

1051 CACTACATTG CCCATAAGAT TGCCCATGCC ATAGCGGGCT GTGCGGCAGC

1101 GGCGGCGAAT AAGGGCAAGT GTCAAGATGG TGCGATCGGT GCGGCGGTCG

1151 GTGAAATCCT TGGCGAAACC CTACTGGACG GCAGAGACCC TGGCAGCCTG

1201 AATGTGAAGG ACAGGGCAAA AATCATTGCT AAGGCGAAGC TGGCAGCAGG

1251 GGCGGTTGCG GCGTTGAGTA AGGGGGATGT GAGTACGGCG GCGAATGCGG

1301 CTGCTGTGGC GGTAGAGAAT AATTCTTTAA ATGATATACA GGATCGTTTG

1351 TTGAGTGGAA ATTATGCTTT ATGTATGAGT GCAGGAGGAG CAGAAAGCTT

1401 TTGTGAGTCT TATCGACCAC TGGGCTTGCC ACACTTTGTA AGTGTTTCAG

1451 GAGAAATGAA ATTACCTAAT AAATTCGGGA ATCGTATGGT TAATGGAAAA

1501 TTAATTATTA ACACTAGAAA TGGCAATGTA TATTTCTCTG TAGGTAAAAT

1551 ATGGAGTACT GTAAAATCAA CAAAATCAAA TATAAGTGGG GTATCTGTCG

1601 GTTGGGTTTT AAATGTTTCC CCTAATGATT ATTTAAAAGA AGCATCTATG

1651 AATGATTTCA GAAATAGTAA TCAAAATAAA GCCTATGCAG AAATGATTTC

1701 CCAGACTTTG GTAGGTGAGA GTGTTGGTGG TAGTCTTTGT CTGACAAGAG

1751 CCTGCTTTTC GGTAAGTTCA ACAATATCTA AATCTAAATC TCCTTTTAAA

1801 GATTCAAAAA TTATTGGGGA AATCGGTTTG GGAAGTGGTG TTGCTGCAGG

1851 AGTAGAAAAA ACAATATACA TAGGTAACAT AAAAGATATT GATAAATTTA

1901 TTAGTGCAAA CATAAAAAAA TAG

它对应于氨基酸序列<SEQ ID 20；ORF49-1>：

1 MQLLAAEGIH QHQLNVQKST RFIGIKVGKS NYSKNELNET KLPVRVIAQT

51 AKTRSGWDTV LEGTEFKTTL SGADIQAGVG EKARADAKII LKGIVNRIQT

101 EEKLESNSTV WQKQAGSGST VETLKLPSFE GPALPKLTAP GGYIADIPKG

151 NLKTEIEKLA KQPEYAYLKQ LQTVKDVNWN QVQLAYDKWD YKQEG LTGAG

201 AAIIALAVTV VTSGAGTGAV LGLNGAAAAA TDAAFASLAS QASVSFINNK

251 GNIGNTLKEL GRSSTVKNLM VAVATAGVAD KIGASALNNV SDKQWINNLT

301 VNLANAGSAA LINTAVNGGS LKDNLEANIL AALVNTAHGE AASKIKQLDQ

351 HYIAHKIAHA IAGCAAAAAN KGKCQDGAIG AAVGEILGET LLDGRDPGSL

401 NVKDRAKIIA KAKLAAGAVA ALSKGDVSTA ANAAAVAVEN NSLNDIQDRL

451 LSGNYALCMS AGGAESFCES YRPLGLPHFV SVSGEMKLPN KFGNRMVNGK

501 LIINTRNGNV YFSVGKIWST VKSTKSNISG VSVGWVLNVS PNDYLKEASM

551 NDFRNSNQNK AYAEMISQTL VGESVGGSLC LTRACFSVSS TISKSKSPFK

601 DSKIIGEIGL GSGVAAGVEK TIYIGNIKDI DKFISANIKK*

计算机分析预计了一个跨膜结构域，还表明ORF49与已知的蛋白质没有明显的氨基酸同源性。然而，鉴定出脑膜炎奈瑟氏球菌菌株A的相应ORF：

ORF49显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF49a)重叠的173个氨基酸内有86.1％的相同性：

10 20 30

orf49.pep GTEFKTTLSGADIQAGVGEKARADAKIILK

||||||||:|||||||| ||||:|||||||

orf49a SKNELNETKLPVRVVAQXAATRSGWDTVLEGTEFKTTLAGADIQAGVXEKARVDAKIILK

40 50 60 70 80 90

orf49.pep GIVNRIQTEEKLESNSTVWQKQAGSGSTVETLKLPSFEGPALPKLTAPGGYIADIPKGNL

|||||||:|||||:|||||||||| |||:|||||||||:|: |||:||||||:|||||||

orf49a GIVNRIQSEEKLETNSTVWQKQAGRGSTIETLKLPSFESPTPPKLSAPGGYIVDIPKGNL

100 110 120 130 140 150

orf49.pep KTEIEKLAKQPEYAYLKQLQTVKDVNWNQVQLAYDKWDYKQEG LTGAGAAIXALAVTVVT

|||||||:||||||||||||::|::||||||||||:||||||| || ||||| ||||||||

orf49a KTEIEKLSKQPEYAYLKQLQVAKNINWNQVQLAYDRWDYKQEG LTEAGAAIIALAVTVVT

160 170 180 190 200 210

160 170

orf49.pep SGAGTGAVLGLXRVAAAATDAAF

||||||||||| : ||||||||

orf49a SGAGTGAVLGLNGAXAAATDAAFASLASQASVSFINNKGDVGKTLKELGRSSTVKNLVVA

220 230 240 250 260 270

ORF49-1和ORF49a显示在457个重叠的氨基酸内有83.2％的相同性：

orf49a.pep XQLLAEEGIHKHELDVQKSRRFIGIKVGXSNYSKNELNETKLPVRVVAQXAATRSGWDTV

|||| ||||:|:|:|||| |||||||| |||||||||||||||||:||:| ||||||||

orf49-1 MQLLAAEGIHQHQLNVQKSTRFIGIKVGKSNYSKNELNETKLPVRVIAQTAKTRSGWDTV

orf49a.pep LEGTEFKTTLAGADIQAGVXEKARVDAKIILKGIVNRIQSEEKLETNSTVWQKQAGRGST

||||||||||:|||||||| ||||:||||||||||||||:|||||:|||||||||| |||

orf49-1 LEGTEFKTTLSGADIQAGVGEKARADAKIILKGIVNRIQTEEKLESNSTVWQKQAGSGST

orf49a.pep IETLKLPSFESPTPPKLSAPGGYIVDIPKGNLKTEIEKLSKQPEYAYLKQLQVAKNINWN

:|||||||||:|: |||:||||||:||||||||||||||:||||||||||||::|::|||

orf49-1 VETLKLPSFEGPALPKLTAPGGYIADIPKGNLKTEIEKLAKQPEYAYLKQLQTVKDVNWN

orf49a.pep QVQLAYDRWDYKQEGLTEAGAAIIALAVTVVTSGAGTGAVLGLNGAXAAATDAAFASLAS

|||||||:||||||||| |||||||||||||||||||||||||||| |||||||||||||

orf49-1 QVQLAYDKWDYKQEGLTGAGAAIIALAVTVVTSGAGTGAVLGLNGAAAAATDAAFASLAS

orf49a.pep QASVSFINNKGDVGKTLKELGRSSTVKNLVVAAATAGVADKIGASALXNVSDKQWINNLT

|||||||||||::|:||||||||||||||:||:|||||||||||||| ||||||||||||

orf49-1 QASVSFINNKGNIGNTLKELGRSSTVKNLMVAVATAGVADKIGASALNNVSDKQWINNLT

orf49a.pep VNLANAGSAALINTAVNGGSLKDXLEANILAALVNTAHGEAASKIKQLDQHYIVHKIAHA

||||||||||||||||||||||| |||||||||||||||||||||||||||||:||||||

orf49-1 VNLANAGSAALINTAVNGGSLKDNLEANILAALVNTAHGEAASKIKQLDQHYIAHKIAHA

orf49a.pep IAGCAAAAANKGKCQDGAIGAAVGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVS

||||||||||||||||||||||||||:||:| :|::| :|::|:| :|:| :||:||:|:

orf49-1 IAGCAAAAANKGKCQDGAIGAAVGEILGETLLDGRDPGSLNVKDRAKIIAKAKLAAGAVA

orf49a.pep GVVGGDVNAAANAAEVAVKNNQLSDXEGREFDNEMTACAKQNXPQLCRKNTVKKYQNVAD

:: |||::||||| |||:||:|:| : | :::::: |

orf49-1 ALSKGDVSTAANAAAVAVENNSLNDIQDRLLSGNYALCMSAGGAESFCESYRPLGLPHFV

orf49a.pep KRLAASIAICTDISRSTECRTIRKQHLIDSRSLHSSWEAGLIGKDDEWYKLFSKSYTQAD

orf49-1 SVSGEMKLPNKFGNRMVNGKLIINTRNGNVYFSVGKIWSTVKSTKSNISGVSVGWVLNVS

全长ORF49a的核苷酸序列<SEQ ID 21>是：

1 NTGCAACTGC TGGCAGAAGA AGGCATCCAC AAGCACGAGT TGGATGTCCA

51 AAAAAGCCGC CGCTTTATCG GCATCAAGGT AGGTNAGAGC AATTACAGTA

101 AAAACGAACT GAACGAAACC AAATTGCCTG TCCGCGTCGT CGCCCAAANT

151 GCAGCCACCC GTTCAGGCTG GGATACCGTG CTCGAAGGTA CCGAATTCAA

201 AACCACGCTG GCCGGTGCCG ACATTCAGGC AGGTGTANGC GAAAAAGCCC

251 GTGTCGATGC GAAAATTATC CTCAAAGGCA TTGTGAACCG TATCCAGTCG

301 GAAGAAAAAT TAGAAACCAA CTCAACCGTA TGGCAGAAAC AGGCCGGACG

351 CGGCAGCACT ATCGAAACGC TAAAACTGCC CAGCTTCGAA AGCCCTACTC

401 CGCCCAAATT GTCCGCACCC GGCGGNTATA TCGTCGACAT TCCGAAAGGC

451 AATCTGAAAA CCGAAATCGA AAAGCTGTCC AAACAGCCCG AGTATGCCTA

501 TCTGAAACAG CTCCAAGTAG CGAAAAACAT CAACTGGAAT CAGGTGCAGC

551 TTGCTTACGA CAGATGGGAC TACAAACAGG AGGGCTTAAC CGAAGCAGGT

601 GCGGCGATTA TCGCACTGGC CGTTACCGTG GTCACCTCAG GCGCAGGAAC

651 CGGAGCCGTA TTGGGATTAA ACGGTGCGNC CGCCGCCGCA ACCGATGCAG

701 CATTCGCCTC TTTGGCCAGC CAGGCTTCCG TATCGTTCAT CAACAACAAA

751 GGCGATGTCG GCAAAACCCT GAAAGAGCTG GGCAGAAGCA GCACGGTGAA

801 AAATCTGGTG GTTGCCGCCG CTACCGCAGG CGTAGCCGAC AAAATCGGCG

851 CTTCGGCACT GANCAATGTC AGCGATAAGC AGTGGATCAA CAACCTGACC

901 GTCAACCTAG CCAATGCGGG CAGTGCCGCA CTGATTAATA CCGCTGTCAA

951 CGGCGGCAGC CTGAAAGACA NTCTGGAAGC GAATATCCTT GCGGCTTTGG

1001 TCAATACCGC GCATGGAGAA GCAGCCAGTA AAATCAAACA GTTGGATCAG

1051 CACTACATAG TCCACAAGAT TGCCCATGCC ATAGCGGGCT GTGCGGCAGC

1101 GGCGGCGAAT AAGGGCAAGT GTCAGGATGG TGCGATAGGT GCGGCTGTGG

1151 GCGAGATAGT CGGGGAGGCT TTGACAAACG GCAAAAATCC TGACACTTTG

1201 ACAGCTAAAG AACGCGAACA GATTTTGGCA TACAGCAAAC TGGTTGCCGG

1251 TACGGTAAGC GGTGTGGTCG GCGGCGATGT AAATGCGGCG GCGAATGCGG

1301 CTGAGGTAGC GGTGAAAAAT AATCAGCTTA GCGACNAAGA GGGTAGAGAA

1351 TTTGATAACG AAATGACTGC ATGCGCCAAA CAGAATANTC CTCAACTGTG

1401 CAGAAAAAAT ACTGTAAAAA AGTATCAAAA TGTTGCTGAT AAAAGACTTG

1451 CTGCTTCGAT TGCAATATGT ACGGATATAT CCCGTAGTAC TGAATGTAGA

1501 ACAATCAGAA AACAACATTT GATCGATAGT AGAAGCCTTC ATTCATCTTG

1551 GGAAGCAGGT CTAATTGGTA AAGATGATGA ATGGTATAAA TTATTCAGCA

1601 AATCTTACAC CCAAGCAGAT TTGGCTTTAC AGTCTTATCA TTTGAATACT

1651 GCTGCTAAAT CTTGGCTTCA ATCGGGCAAT ACAAAGCCTT TATCCGAATG

1701 GATGTCCGAC CAAGGTTATA CACTTATTTC AGGAGTTAAT CCTAGATTCA

1751 TTCCAATACC AAGAGGGTTT GTAAAACAAA ATACACCTAT TACTAATGTC

1801 AAATACCCGG AAGGCATCAG TTTCGATACA AACCTANAAA GACATCTGGC

1851 AAATGCTGAT GGTTTTAGTC AAGAACAGGG CATTAAAGGA GCCCATAACC

1901 GCACCAATNT TATGGCAGAA CTAAATTCAC GAGGAGGANG NGTAAAATCT

1951 GAAACCCANA CTGATATTGA AGGCATTACC CGAATTAAAT ATGAGATTCC

2001 TACACTAGAC AGGACAGGTA AACCTGATGG TGGATTTAAG GAAATTTCAA

2051 GTATAAAAAC TGTTTATAAT CCTAAAAANT TTTNNGATGA TAAAATACTT

2101 CAAATGGCTC AANATGCTGN TTCACAAGGA TATTCAAAAG CCTCTAAAAT

2151 TGCTCAAAAT GAAAGAACTA AATCAATATC GGAAAGAAAA AATGTCATTC

2201 AATTCTCAGA AACCTTTGAC GGAATCAAAT TTAGANNNTA TNTNGATGTA

2251 AATACAGGAA GAATTACAAA CATTCACCCA GAATAATTTA A

它编码的蛋白质具有氨基酸序列<SEQ ID 22>：

1 XQLLAEEGIH KHELDVQKSR RFIGIKVGXS NYSKNELNET KLPVRVVAQX

51 AATRSGWDTV LEGTEFKTTL AGADIQAGVX EKARVDAKII LKGIVNRIQS

101 EEKLETNSTV WQKQAGRGST IETLKLPSFE SPTPPKLSAP GGYIVDIPKG

151 NLKTEIEKLS KQPEYAYLKQ LQVAKNINWN QVQLAYDRWD YKQEG LTEAG

201 AAIIALAVTV VTSGAGTGAV LGLNGAXAAA TDAAFASLAS QASVSFINNK

251 GDVGKTLKEL GRSSTVKNLV VAAATAGVAD KIGASALXNV SDKQWINNLT

301 VNLANAGSAA LINTAVNGGS LKDXLEANIL AALVNTAHGE AASKIKQLDQ

351 HYIVHKIAHA IAGCAAAAAN KGKCQDGAIG AAVGEIVGEA LTNGKNPDTL

401 TAKEREQILA YSKLVAGTVS GVVGGDVNAA ANAAEVAVKN NQLSDXEGRE

451 FDNEMTACAK QNXPQLCRKN TVKKYQNVAD KRLAASIAIC TDISRSTECR

501 TIRKQHLIDS RSLHSSWEAG LIGKDDEWYK LFSKSYTQAD LALQSYHLNT

551 AAKSWLQSGN TKPLSEWMSD QGYTLISGVN PRFIPIPRGF VKQNTPITNV

601 KYPEGISFDT NLXRHLANAD GFSQEQGIKG AHNRTNXMAE LNSRGGXVKS

651 ETXTDIEGIT RIKYEIPTLD RTGKPDGGFK EISSIKTVYN PKXFXDDKIL

701 QMAQXAXSQG YSKASKIAQN ERTKSISERK NVIQFSETFD GIKFRXYXDV

751 NTGRITNIHP E*

根据推定跨膜结构域的存在，预计脑膜炎奈瑟氏球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原。

实施例5

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 23>

1 ..CGGATCGTTG TAGGTTTGCG GATTTCTTGC GCCGTAGTCA CCGTAGTCCC

51 AAGTATAACC CAAGGCTTTG TCTTCGCCTT TCATTCCGAT AAGGGATATG

101 ACGCTTTGGT CGGTATAGCC GTCTTGGGAA CCTTTGTCCA CCCAACGCAT

151 ATCTGCCTGC GGATTCTCAT TGCCGCTTCT TGGCTGCTGA TTTTTCTGCC

201 TTCGCGTTTT TCAACTTCGC GCTTGAGGGC TTCGGCATAT TTGTCGGCCA

251 ACGCCATTTC TTTCGGATGC AGCTGCCTAT TGTTCCAATC TACATTCGCA

301 CCCACCACAG CACCACCACT ACCACCAGTT GCATAG

它对应于氨基酸序列<SEQ ID 24；ORF50>：

1 ..R IVVGLRISC AVVTVVPSIT QGFVFAFHSD KGYDALVGIA VLGTFVHPTH

51 ICLRILIAAS WLLIFLPSRF STSRLRASAY LSANAISFGC SCLLFQSTFA

101 PTTAPPLPPV A*

计算机分析预计了两个跨膜结构域，并且还表明ORF50与已知蛋白质没有明显的氨基酸同源性。

实施例6

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 25>

1 ..AAGTTTGACT TTACCTGGTT TATTCCGGCG GTAATCAAAT ACCGCCGGTT

51 GTTTTTTGAA GTATTGGTGG TGTCGGTGGT GTTGCAGCTG TTTGCGCTGA

101 TTACGCCTCT GTTTTTCCAA GTGGTGATGG ACAAGGTGCT GGTACATCGG

151 GGATTCTCTA CTTTGGATGT GGTGTCGGTG GCTTTGTTGG TGGTGTCGCT

201 GTTTGAGATT GTGTTGGGCG GTTTGCGGAC GTATCTGTTT GCACATACGA

251 CTTCACGTAT TGATGTGGAA TTGGGCGCGC GTTTGTTCCG GCATCTGCTT

301 TCCCTGCCTT TATCCTATTT CGAGCACAGA CGAGTGGGTG ATACGGTGGC

351 TCGGGTGCGG GAATTGGAGC AGATTCGCAA TTTCTTGACC GGTCAGGCGC

401 TGACTTCGGT GTTGGATTTG GCGTTTTCGT TTATCTTTCT GGCGGTGATG

451 TGGTATTACA GCTCCACTCT GACTTGGGTG GTATTGGCTT CGTTG.....

//

1451 .......... .......... .......... .......... ..........

1501 .......... .......... .......... .......... ..ATTTGCGC

1551 CAACCGGACG GTGCTGATTA TCGCCCACCG TCTGTCCACT GTTAAAACGG

1601 CACACCGGAT CATTGCCATG GATAAAGGCA GGATTGTGGA AGCGGGAACA

1651 CAGCAGGAAT TGCTGGCGAA CG..AACGGA TATTACCGCT ATCTGTATGA

1701 TTTACAGAAC GGGTAG

它对应于氨基酸序列<SEQ ID 26；ORF39>：

1 ..KFLFTWFIPA VIKYRRLFFE VLVVSVVLQL FALITPLFFQ VVMDKVLVHR

51 GFSTLDVVSV ALLVVSLFEI VLGGLRTYLF AHTTSRIDVE LGARLFRHLL

101 SLPLSYFEHR RVGDTVARVR ELEQIRNFLT GQALTSVLDL AFSFIFLAVM

151 WYYSSTLTWV VLASL..... .......... .......... ..........

//

501 .......... ....ICANRT VLIIAHRLST VKTAHRIIAM DKGRIVEAGT

551 QQELLANXNG YYRYLYDLQN G*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 27>：

1 ATGTCTATCG TATCCGCACC GCTCCCCGCC CTTTCCGCCC TCATCATCCT

51 CGCCCATTAC CACGGCATTG CCGCCAATCC TGCCGATATA CAGCATGAAT

101 TTTGTACTTC CGCACAGAGC GATTTAAATG AAACGCAATG GCTGTTAGCC

151 GCCAAATCTT TGGGATTGAA GGCAAAGGTA GTCCGCCAGC CTATTAAACG

201 TTTGGCTATG GCGACTTTAC CCGCATTGGT ATGGTGTGAT GACGGCAACC

251 ATTTCATTTT GGCCAAAACA GACGGTGAGG GTGAGCATGC CCAATTTTTG

301 ATACAGGATT TGGTTACGAA TAAGTCTGCG GTATTGTCTT TTGCCGAATT

351 TTCTAACAGA TATTCGGGCA AACTGATATT GGTTGCTTCC CGCGCTTCGG

401 TATTGGGCAG TTTGGCAAAG TTTGACTTTA CCTGGTTTAT TCCGGCGGTA

451 ATCAAATACC GCCGGTTGTT TTTTGAAGTA TTGGTGGTGT CGGTGGTGTT

501 GCAGCTGTTT GCGCTGATTA CGCCTCTGTT TTTCCAAGTG GTGATGGACA

551 AGGTGCTGGT ACATCGGGGA TTCTCTACTT TGGATGTGGT GTCGGTGGCT

601 TTGTTGGTGG TGTCGCTGTT TGAGATTGTG TTGGGCGGTT TGCGGACGTA

651 TCTGTTTGCA CATACGACTT CACGTATTGA TGTGGAATTG GGCGCGCGTT

701 TGTTCCGGCA TCTGCTTTCC CTGCCTTTAT CCTATTTCGA GCACAGACGA

751 GTGGGTGATA CGGTGGCTCG GGTGCGGGAA TTGGAGCAGA TTCGCAATTT

801 CTTGACCGGT CAGGCGCTGA CTTCGGTGTT GGATTTGGCG TTTTCGTTTA

851 TCTTTCTGGC GGTGATGTGG TATTACAGCT CCACTCTGAC TTGGGTGGTA

901 TTGGCTTCGT TGCCTGCCTA TGCGTTTTGG TCGGCATTTA TCAGTCCGAT

951 ACTGCGGACG CGTCTGAACG ATAAGTTCGC GCGCAATGCA GACAACCAGT

1001 CGTTTTTAGT AGAAAGCATC ACTGCGGTGG GTACGGTAAA GGCGATGGCG

1051 GTGGAGCCGC AGATGACGCA GCGTTGGGAC AATCAGTTGG CGGCTTATGT

1101 GGCTTCGGGA TTTCGGGTAA CGAAGTTGGC GGTGGTCGGC CAGCAGGGGG

1151 TGCAGCTGAT TCAGAAGCTG GTGACGGTGG CGACGTTGTG GATTGGCGCA

1201 CGGCTGGTAA TTGAGAGCAA GCTGACGGTG GGGCAGCTGA TTGCGTTTAA

1251 TATGCTCTCG GGACAGGTGG CGGCGCCTGT TATCCGTTTG GCGCAGTTGT

1301 GGCAGGATTT CCAGCAGGTG GGGATTTCGG TGGCGCGTTT GGGGGATATT

1351 CTGAATGCGC CGACCGAGAA TGCGTCTTCG CATTTGGCTT TGCCCGATAT

1401 CCGGGGGGAG ATTACGTTCG AACATGTCGA TTTCCGCTAT AAGGCGGACG

1451 GCAGGCTGAT TTTGCAGGAT TTGAACCTGC GGATTCGGGC GGGGGAAGTG

1501 CTGGGGATTG TGGGACGTTC GGGGTCGGGC AAATCCACAC TCACCAAATT

1551 GGTGCAGCGT CTGTATGTAC CGGAGCAGGG ACGGGTGTTG GTGGACGGCA

1601 ACGATTTGGC TTTGGCCGCT CCTGCCTGGC TGCGGCGGCA GGTCGGCGTG

1651 GTCTTGCAGG AGAATGTGCT GCTCAACCGC AGCATACGCG ACAATATCGC

1701 GCTGACGGAT ACGGGTATGC CGCTGGAACG CATTATCGAA GCAGCCAAAC

1751 TGGCGGGCGC ACACGAGTTT ATTATGGAGC TGCCGGAAGG CTACGGCACC

1801 GTGGTGGGCG AACAAGGGGC CGGCTTGTCG GGCGGACAGC GGCAGCGTAT

1851 TGCGATTGCC CGCGCGTTAA TCACCAATCC GCGCATTCTG ATTTTTGATG

1901 AAGCCACCAG CGCGCTGGAT TATGAAAGTG AACGAGCGAT TATGCAGAAC

1951 ATGCAGGCCA TTTGCGCCAA CCGGACGGTG CTGATTATCG CCCACCGTCT

2001 GTCCACTGTT AAAACGGCAC ACCGGATCAT TGCCATGGAT AAAGGCAGGA

2051 TTGTGGAAGC GGGAACACAG CAGGAATTGC TGGCGAAGCC GAACGGATAT

2101 TACCGCTATC TGTATGATTT ACAGAACGGG TAG

它对应于氨基酸序列<SEQ ID 28；ORF39-1>：

1 MSIVSAPLPA LSALIILAHY HGIAANPADI QHEFCTSAQS DLNETQWLLA

51 AKSLGLKAKV VRQPIKRLAM ATLPALVWCD DGNHFILAKT DGEGEHAQFL

101 IQDLVTNKSA VLSFAEFSNR YSGKLILVAS RASVLGSLAK FDFTWFIPAV

151 IKYRRL FFEV LVVSVVLQLF ALITPLFFQV VMDKVLVHRG FSTLD VVSVA

201 LLVVSLFEIV LGGLRTYLFA HTTSRIDVEL GARLFRHLLS LPLSYFEHRR

251 VGDTVARVRE LEQIRNFLTG QA LTSVLDLA FSFIFLAVMW YYSSTLTW VV

301 LASLPAYAFW SAFISPILRT RLNDKFARNA DNQSFLVESI TAVGTVKAMA

351 VEPQMTQRWD NQLAAYVASG FRVTKLAVVG QQGVQLIQKL VTVATLWIGA

401 RLVIESKLTV GQLIAFNMLS GQVAAPVIRL AQLWQDFQQV GISVARLGDI

451 LNAPTENASS HLALPDIRGE ITFEHVDFRY KADGRLILQD LNLRIRAGEV

501 LGIVGRSGSG KSTLTKLVQR LYVPEQGRVL VDGNDLALAA PAWLRRQVGV

551 VLQENVLLNR SIRDNIALTD TGMPLERIIE AAKLAGAHEF IMELPEGYGT

601 VVGEQGAGLS GGQRQRIAIA RALITNPRIL IFDEATSALD YESERAIMQN

651 MQAICANRTV LIIAHRLSTV KTAHRIIAMD KGRIVEAGTQ QELLAKPNGY

701 YRYLYDLQNG*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性

ORF39显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF39a)重叠的165个氨基酸内有100％的相同性：

10 20 30

orf39.pep KFDFTWFIPAVIKYRRL FFEVLVVSVVLQL

||||||||||||||||| |||||||||||||

orf39a AVLSFAEFSNRYSGKLILVASRASVLGSLAKFDFTWFIPAVIKYRRL FFEVLVVSVVLQL

110 120 130 140 150 160

40 50 60 70 80 90

orf39.pep FALITPLFFQVVMDKVLVHRGFSTLD VVSVALLVVSLFEIVLGGLRTYLFAHTTSRIDVE

|||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||||||||

orf39a FALITPLFFQVVMDKVLVHRGFSTLD VVSVALLVVSLFEIVLGGLRTYLFAHTTSRIDVE

170 180 190 200 210 220

100 110 120 130 140 150

orf39.pep LGARLFRHLLSLPLSYFEHRRVGDTVARVRELEQIRNFLTGQA LTSVLDLAFSFIFLAVM

||||||||||||||||||||||||||||||||||||||||||| |||||||||||||||||

orf39a LGARLFRHLLSLPLSYFEHRRVGDTVARVRELEQIRNFLTGQA LTSVLDLAFSFIFLAVM

230 240 250 260 270 280

160 170 180 190 200 210

orf39.pep WYYSSTLTW VVLASLXXXXXXXXXXXXXXXXXXXXXXXXXXXXICANRTVLIIAHRLSTV

||||||||| ||||||

orf39a WYYSSTLTW VVLASLPAYAFWSAFISPILRTRLNDKFARNADNQSFLVESITAVGTVKAM

290 300 310 320 330 340

ORF39-1和ORF39a显示在710个重叠的氨基酸内有99.4％的相同性：

orf39-1.pep MSIVSAPLPALSALIILAHYHGIAANPADIQHEFCTSAQSDLNETQWLLAAKSLGLKAKV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf39a MSIVSAPLPALSALIILAHYHGIAANPADIQHEFCTSAQSDLNETQWLLAAKSLGLKAKV

orf39-1.pep VRQPIKRLAMATLPALVWCDDGNHFILAKTDGEGEHAQFLIQDLVTNKSAVLSFAEFSNR

|||||||||||||||||||||||||||||||| |||||:|||||:|||||||||||||||

orf39a VRQPIKRLAMATLPALVWCDDGNHFILAKTDGGGEHAQYLIQDLTTNKSAVLSFAEFSNR

orf39-1.pep YSGKLILVASRASVLGSLAKFDFTWFIPAVIKYRRLFFEVLVVSVVLQLFALITPLFFQV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf39a YSGKLILVASRASVLGSLAKFDFTWFIPAVIKYRRLFFEVLVVSVVLQLFALITPLFFQV

orf39-1.pep VMDKVLVHRGFSTLDVVSVALLVVSLFEIVLGGLRTYLFAHTTSRIDVELGARLFRHLLS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf39a VMDKVLVHRGFSTLDVVSVALLVVSLFEIVLGGLRTYLFAHTTSRIDVELGARLFRHLLS

orf39-1.pep LPLSYFEHRRVGDTVARVRELEQIRNFLTGQALTSVLDLAFSFIFLAVMWYYSSTLTWVV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf39a LPLSYFEHRRVGDTVARVRELEQIRNFLTGQALTSVLDLAFSFIFLAVMWYYSSTLTWVV

orf39-1.pep LASLPAYAFWSAFISPILRTRLNDKFARNADNQSFLVESITAVGTVKAMAVEPQMTQRWD

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf39a LASLPAYAFWSAFISPILRTRLNDKFARNADNQSFLVESITAVGTVKAMAVEPQMTQRWD

orf39-1.pep NQLAAYVASGFRVTKLAVVGQQGVQLIQKLVTVATLWIGARLVIESKLTVGQLIAFNMLS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf39a NQLAAYVASGFRVTKLAVVGQQGVQLIQKLVTVATLWIGARLVIESKLTVGQLIAFNMLS

orf39-1.pep GQVAAPVIRLAQLWQDFQQVGISVARLGDILNAPTENASSHLALPDIRGEITFEHVDFRY

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| |

orf39a GQVAAPVIRLAQLWQDFQQVGISVARLGDILNAPTENASSHLALPDIRGEITFEHVDFRY

orf39-1.pep KADGRLILQDLNLRIRAGEVLGIVGRSGSGKSTLTKLVQRLYVPEQGRVLVDGNDLALAA

|||||||||||||||||||||||||||||||||||||||||||| |||||||||||||||

orf39a KADGRLILQDLNLRIRAGEVLGIVGRSGSGKSTLTKLVQRLYVPAQGRVLVDGNDLALAA

orf39-1.pep PAWLRRQVGVVLQENVLLNRSIRDNIALTDTGMPLERIIEAAKLAGAHEFIMELPEGYGT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf39a PAWLRRQVGVVLQENVLLNRSIRDNIALTDTGMPLERIIEAAKLAGAHEFIMELPEGYGT

orf39-1.pep VVGEQGAGLSGGQRQRIAIARALITNPRILIFDEATSALDYESERAIMQNMQAICANRTV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf39a VVGEQGAGLSGGQRQRIAIARALITNPRILIFDEATSALDYESERAIMQNMQAICANRTV

orf39-1.pep LIIAHRLSTVKTAHRIIAMDKGRIVEAGTQQELLAKPNGYYRYLYDLQNGX

|||||||||||||||||||||||||||||||||||||||||||||||||||

orf39a LIIAHRLSTVKTAHRIIAMDKGRIVEAGTQQELLAKPNGYYRYLYDLQNGX

全长ORF39a的核苷酸序列<SEQ ID 29>是：

1 ATGTCTATCG TATCCGCACC GCTCCCCGCC CTTTCCGCCC TCATCATCCT

51 CGCCCATTAC CACGGCATTG CCGCCAATCC TGCCGATATA CAGCATGAAT

101 TTTGTACTTC CGCACAGAGC GATTTAAATG AAACGCAATG GCTGTTAGCC

151 GCCAAATCTT TGGGATTGAA GGCAAAGGTA GTCCGCCAGC CTATTAAACG

201 TTTGGCTATG GCGACTTTAC CCGCATTGGT ATGGTGTGAT GACGGCAACC

251 ATTTTATTTT GGCTAAAACA GACGGTGGGG GTGAGCATGC CCAATATCTA

301 ATACAGGATT TAACTACGAA TAAGTCTGCG GTATTGTCTT TTGCCGAATT

351 TTCTAACAGA TATTCGGGCA AACTGATATT GGTTGCTTCC CGCGCTTCGG

401 TATTGGGCAG TTTGGCAAAG TTTGACTTTA CCTGGTTTAT TCCGGCGGTA

451 ATCAAATACC GCCGGTTGTT TTTTGAAGTA TTGGTGGTGT CGGTGGTGTT

501 GCAGCTGTTT GCGCTGATTA CGCCTCTGTT TTTCCAAGTG GTGATGGACA

551 AGGTGCTGGT ACATCGGGGA TTCTCTACTT TGGATGTGGT GTCGGTGGCT

601 TTGTTGGTGG TGTCGCTGTT TGAGATTGTG TTGGGCGGTT TGCGGACGTA

651 TCTGTTTGCA CATACGACTT CACGTATTGA TGTGGAATTG GGCGCGCGTT

701 TGTTCCGGCA TCTGCTTTCC CTGCCTTTAT CCTATTTCGA GCACAGACGA

751 GTGGGTGATA CGGTGGCTCG GGTGCGGGAA TTGGAGCAGA TTCGCAATTT

801 CTTGACCGGT CAGGCGCTGA CTTCGGTGTT GGATTTGGCG TTTTCGTTTA

851 TCTTTCTGGC GGTGATGTGG TATTACAGCT CCACTCTGAC TTGGGTGGTA

901 TTGGCTTCGT TGCCTGCCTA TGCGTTTTGG TCGGCATTTA TCAGTCCGAT

951 ACTGCGGACG CGTCTGAACG ATAAGTTCGC GCGCAATGCA GACAACCAGT

1001 CGTTTTTAGT AGAAAGCATC ACTGCGGTGG GTACGGTAAA GGCGATGGCG

1051 GTGGAGCCGC AGATGACGCA GCGTTGGGAC AATCAGTTGG CGGCTTATGT

1101 GGCTTCGGGA TTTCGGGTAA CGAAGTTGGC GGTGGTCGGC CAGCAGGGGG

1151 TGCAGCTGAT TCAGAAGCTG GTGACGGTGG CGACGTTGTG GATTGGCGCA

1201 CGGCTGGTAA TTGAGAGCAA GCTGACGGTG GGGCAGCTGA TTGCGTTTAA

1251 TATGCTCTCG GGACAGGTGG CGGCGCCTGT TATCCGTTTG GCGCAGTTGT

1301 GGCAGGATTT CCAGCAGGTG GGGATTTCGG TGGCGCGTTT GGGGGATATT

1351 CTGAATGCGC CGACCGAGAA TGCGTCTTCG CATTTGGCTT TGCCCGATAT

1401 CCGGGGGGAG ATTACGTTCG AACATGTCGA TTTCCGCTAT AAGGCGGACG

1451 GCAGGCTGAT TTTGCAGGAT TTGAACCTGC GGATTCGGGC GGGGGAAGTG

1501 CTGGGGATTG TGGGACGTTC GGGGTCGGGC AAATCCACAC TCACCAAATT

1551 GGTGCAGCGT CTGTATGTAC CGGCGCAGGG ACGGGTGTTG GTGGACGGCA

1601 ACGATTTGGC TTTGGCCGCT CCTGCTTGGC TGCGGCGGCA GGTCGGCGTG

1651 GTCTTGCAGG AGAATGTGCT GCTCAACCGC AGCATACGCG ACAATATCGC

1701 GCTGACGGAT ACGGGTATGC CGCTGGAACG CATTATCGAA GCAGCCAAAC

1751 TGGCGGGCGC ACACGAGTTT ATTATGGAGC TGCCGGAAGG CTACGGCACC

1801 GTGGTGGGCG AACAAGGGGC CGGCTTGTCG GGCGGACAGC GGCAGCGTAT

1851 TGCGATTGCC CGCGCGTTAA TCACCAATCC GCGCATTCTG ATTTTTGATG

1901 AAGCCACCAG CGCGCTGGAT TATGAAAGTG AACGAGCGAT TATGCAGAAC

1951 ATGCAGGCCA TTTGCGCCAA CCGGACGGTG CTGATTATCG CCCACCGTCT

2001 GTCCACTGTT AAAACGGCAC ACCGGATCAT TGCCATGGAT AAAGGCAGGA

2051 TTGTGGAAGC GGGAACACAG CAGGAATTGC TGGCGAAGCC GAACGGATAT

2101 TACCGCTATC TGTATGATTT ACAGAACGGG TAG

它编码的蛋白质具有氨基酸序列<SEQ ID 30>：

1 MSIVSAPLPA LSALIILAHY HGIAANPADI QHEFCTSAQS DLNETQWLLA

51 AKSLGLKAKV VRQPIKRLAM ATLPALVWCD DGNHFILAKT DGGGEHAQYL

101 IQDLTTNKSA VLSFAEFSNR YSGKLILVAS RASVLGSLAK FDFTWFIPAV

151 IKYRRL FFEV LVVSVVLQLF ALITPLFFQV VMDKVLVHRG FSTLD VVSVA

201 LLVVSLFEIV LGGLRTYLFA HTTSRIDVEL GARLFRHLLS LPLSYFEHRR

251 VGDTVARVRE LEQIRNFLTG QA LTSVLDLA FSFIFLAVMW YYSSTLTW VV

301 LASLPAYAFW SAFISPILRT RLNDKFARNA DNQSFLVESI TAVGTVKAMA

351 VEPQMTQRWD NQLAAYVASG FRVTKLAVVG QQGVQLIQKL VTVATLWIGA

401 RLVIESKLTV GQLIAFNMLS GQVAAPVIRL AQLWQDFQQV GISVARLGDI

451 LNAPTENASS HLALPDIRGE ITFEHVDFRY KADGRLILQD LNLRIRAGEV

501 LGIVGRSGSG KSTLTKLVQR LYVPAQGRVL VDGNDLALAA PAWLRRQVGV

551 VLQENVLLNR SIRDNIALTD TGMPLERIIE AAKLAGAHEF IMELPEGYGT

601 VVGEQGAGLS GGQRQRIAIA RALITNPRIL IFDEATSALD YESERAIMQN

651 MQAICANRTV LIIAHRLSTV KTAHRIIAMD KGRIVEAGTQ QELLAKPNGY

701 YRYLYDLQNG*

ORF39a与大叶性肺炎放线杆菌的溶细胞素同源：

sp|P26760|RT1_ACTPL RTX-I毒素决定簇B(毒素RTX-I分泌ATP-结合蛋白)(APX-IB)(HLY-IB)(溶细胞素IB)(CLY-IB)

＞gi|97137|pir||D43599溶细胞素IB-大叶性肺炎放线杆菌(serotype 9)＞gi|38944(X61112)ClyI-B蛋白[大叶性肺炎放线杆菌]长度＝707

评分＝931bits(2379)，预计＝0.0

相同性＝472/690(68％)，阳性＝540/690(77％)，空隙＝3/690(0％)

询问：20 YHGIAANPADIQHEFCTSAQSDLNETQWXXXXXXXXXXXXVVRQPIKRLAMATLPALVWC 79

YH IA NP +++H+F + L+T W V++I RLA LPALVW

目标：20 YHNIAVNPEELKHKFDLEGKG-LDLTAWLLAAKSLELKAKQVKKAIDRLAFIALPALVWR 78

询问：80 DDGNHFILAKTDGGGEHAQYLIQDLTTNKSAVLSFAEFSNRYSGKLILVASRASVLGSLA 139

+DG HFIL K D E +YLI DL T+ +L AEF + Y GKLILVASRAS++G LA

目标：79 EDGKHFILTKIDN--EAKKYLIFDLETHNPRILEQAEFESLYQGKLILVASRASIVGKLA 136

询问：140 KFDFTWFIPAVIKYRRXXXXXXXXXXXXXXXXXITPLFFQVVMDKVLVHRGFXXXXXXXX 199

KFDFTWFIPAVIKYR+ ITPLFFQVVMDKVLVHRGF

目标：137 KFDFTWFIPAVIKYRKIFIETLIVSIFLQIFALITPLFFQVVMDKVLVHRGFSTLNVITV 196

询问：200 XXXXXXXFEIVLGGLRTYLFAHTTSRIDVELGARLFRHLLSLPLSYFEHRRVGDTVARVR 259

FEIVL GLRTY+FAH+TSRIDVELGARLFRHLL+LP+SYFE+RRVGDTVARVR

目标：197 ALAIVVLFEIVLNGLRTYIFAHSTSRIDVELGARLFRHLLALPISYFENRRVGDTVARVR 256

询问：260 ELEQIRNFLTGQALTSVLDLAFSFIFLAVMWYYSSTLTWVVLASLPAYAFWSAFISPILR 319

EL+QIRNFLTGQALTSVLDL FSFIF AVMWYYS LT V+L SLP Y WS FISPILR

目标：257 ELDQIRNFLTGQALTSVLDLMFSFIFFAVMWYYSPKLTLVILGSLPFYMGWSIFISPILR 316

询问：320 TRLNDKFARNADNQSFLVESITAVGTVKAMAVEPQMTQRWDNQLAAYVASGFRVTKLAVV 379

RL++KFAR ADNQSFLVES+TA+ T+KA+AV PQMT WD QLA+YV++GFRVT LA +

目标：317 RRLDEKFARGADNQSFLVESVTAINTIKALAVTPQMTNTWDKQLASYVSAGFRVTTLATI 376

询问：380 GQQGVQLIQKLVTVATLWIGARLVIESKLTVGQLIAFNMLSGQVAAPVIRLAQLWQDFQQ 439

GQQGVQ IQK+V V TLW+GA LVI L++GQLIAFNMLSGQV APVIRLAQLWQDFQQ

目标：377 GQQGVQFIQKVVMVITLWLGAHLVISGDLSIGQLIAFNMLSGQVIAPVIRLAQLWQDFQQ 436

询问：440 VGISVARLGDILNAPTENASSHLALPDIRGEITFEHVDFRYKADGRLILQDLNLRIRAGE 499

VGISV RLGD+LN+PTE+ LALP+I+G+ITF ++ FRYK D +IL D+NL I+GE

目标：437 VGISVTRLGDVLNSPTESYQGKLALPEIKGDITFRNIRFRYKPDAPVILNDVNLSIQQGE 496

询问：500 VLGIVGRSGSGKSTLTKLVQRLYVPAQGRVLVDGNDLALAAPAWLRRQVGVVLQENVLLN 559

V+GIVGRSGSGKSTLTKL+QR Y+P G+VL+DG+DLALA P WLRRQVGVVLQ+NVLLN

目标：497 VIGIVGRSGSGKSTLTKLIQRFYIPENGQVLIDGHDLALADPNWLRRQVGVVLQDNVLLN 556

询问：560 RSIRDNIALTDTGMPLERIIEAAKLAGAHEFIMELPEGYGTVVGEQGAGLSGGQRQRIAI 619

RSIRDNIAL D GMP+E+I+ AAKLAGAHEFI EL EGY T+VGEQGAGLSGGQRQRIAI

目标：557 RSIRDNIALADPGMPMEKIVHAAKLAGAHEFISELREGYNTIVGEQGAGLSGGQRQRIAI 616

询问：620 ARALITNPRILIFDEATSALDYESERAIMQNMQAICANRTVLIIAHRLSTVKTAHRIIAM 679

ARAL+NP+ILIFDEATSALDYESE IM+NM IC RTV+IIAHRLSTVK A RII M

目标：617 ARALVNNPKILIFDEATSALDYESEHIIMRNMHQICKGRTVIIIAHRLSTVKNADRIIVM 676

询问：680 DKGRIVEAGTQQELLAKPNGYYRYLYDLQN 709

+KG+IVE G +ELLA PNG Y YL+LQ+

目标：677 EKGQIVEQGKHKELLADPNGLYHYLHQLQS 706

与伴放线菌素嗜血菌的HlyB白细胞毒素分泌ATP-结合蛋白(登录号X53955)的同源性

ORF39和HlyB蛋白显示在N端和C端区域的167和55个重叠氨基酸内分别有71％和69％氨基酸相同性：

orf39 1 KFDFTWFIPAVIKYRRXXXXXXXXXXXXXXXXXITPLFFQVVMDKVLVHRGFXXXXXXXX 60

KFDFTWFIPAVIKYR+ ITPLFFQVVMDKVLVHRGF

HlyB 137 KFDFTWFIPAVIKYRKIFIETLIVSIFLQIFALITPLFFQVVMDKVLVHRGFSTLNVITV 196

orf39 61 XXXXXXXFEIVLGGLRTYLFAHTTSRIDVELGARLFRHLLSLPLSYFEHRRVGDTVARVR 120

FEI+LGGLRTY+FAH+TSRIDVELGARLFRHLL+LP+SYFE RRVGDTVARVR

HlyB 197 ALAIVVLFEIILGGLRTYVFAHSTSRIDVELGARLFRHLLALPISYFEARRVGDTVARVR 256

orf39 121 ELEQIRNFLTGQALTSVLDLAFSFIFLAVMWYYSSTLTWVVLASLIC 167

EL+QIRNFLTGQALTS+LDL FSFIF AVMWYYS LT VVL SL C

HlyB 257 ELDQIRNFLTGQALTSILDLLFSFIFFAVMWYYSPKLTLVVLGSLPC 303

//

orf39 166 ICANRTVLIIAHRLSTVKTAHRIIAMDKGRIVEAGTQQELLANXNGYYRYLYDLQ 220

IC NRTVLIIAHRLSTVK A RII MDKG I+E G QELL + G Y YL+ LQ

HlyB 651 ICQNRTVLIIAHRLSTVKNADRIIVMDKGEIIEQGKHQELLKDEKGLYSYLHQLQ 705

实施例7

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 31>

1 ATGAAATACT TGATCCGCAC CGCCTTACTC GCAGTCGCAG CCGCCGGCAT

51 CTACGCCTGC CAACCGCAAT CCGAAGCCGC AGTGCAAGTC AAGGCTGAAA

101 ACAGCCTGAC CGCTATGCGC TTAGCCGTCG CCGACAAACA GGCAGAGATT

151 GACGGGTTGA ACGCCCAAAk sGACGCCGAA ATCAGA...

它对应于氨基酸序列<SEQ ID 32；ORF52>：

1 MKYL IRTALL AVAAAGIYAC QPQSEAAVQV KAENSLTAMR LAVADKQAEI

51 DGLNAQXDAE IR..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 33>：

1 ATGAAATACT TGATCCGCAC CGCCTTACTC GCAGTCGCAG CCGCCGGCAT

51 CTACGCCTGC CAACCGCAAT CCGAAGCCGC AGTGCAAGTC AAGGCTGAAA

101 ACAGCCTGAC CGCTATGCGC TTAGCCGTCG CCGACAAACA GGCAGAGATT

151 GACGGGTTGA ACGCCCAAAT CGACGCCGAA ATCAGACAAC GCGAAGCCGA

201 AGAATTGAAA GACTACCGAT GGATACACGG CGACGCGGAA GTGCCGGAGC

251 TGGAAAAATG A

它对应于氨基酸序列<SEQ ID 34；ORF52-1>：

1 MKYLIRTALL AVAAAGIYAC QPQSEAAVQV KAENSLTAMR LAVADKQAEI

51 DGLNAQIDAE IRQREAEELK DYRWIHGDAE VPELEK*

该氨基酸序列的计算机分析预计了一个原核细胞膜脂蛋白脂质连接部位(下划线)。

如上所述，将ORF52-1(7kDa)克隆到pGex载体中，并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图4A显示了GST-融合物亲和纯化的结果。图4B显示了ORF52-1的亲水性曲线、抗原性指数和AMPHI区域。

实施例8

在脑膜炎奈瑟氏球菌中鉴定出下列DNA序列<SEQ ID 35>

1 ATGGTTATCG GAATATTACT CGCATCAAGC AAGCATGCTC TTGTCATTAC

51 TCTATTGTTA AATCCCGTCT TCCATGCATC CAGTTGCGTA TCGCGTTsGG

101 CAATACGGAA TAAAAtCTGC TGTTCTGCTT TGGCTAAATT TGCCAAATTG

151 TTTATTGTTT CTTTAGGaGC AGCTTGCTTA GCCGCCTTCG CTTTCGACAA

201 CGCCCCCACA GGCGCTTCCC AAGCgTTGCC TACCGTTACC GCACCCGTGG

251 CGATTCCCGC GCCCGCTTCG GCAGCCTGA

它对应于氨基酸序列<SEQ ID 36；ORF56>：

1 MVIGILLASS KHALVITLLL NPVFHASSCV SRXAIRNKIC CSALAKFAKL

51 FIVSLGAACL AAFAFDNAPT GASQALPTVT APVAIPAPAS AA*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 37>：

1 ATGGCTTGTA CAGGTTTGAT GGTTTTTCCG TTAATGGTTA TCGGAATATT

51 ACTTGCATCA AGCAAGCCTG CTCCTTTCCT TACTCTATTG TTAAATGCCG

101 TCTTCCATGC ATCCAGTTGC GTATCGCGTT GGGCAATACG GAATAAAATC

151 TGCTGTTCTG CTTTGGCTAA ATTTGCCAAA TTGTTTATTG TTTCTTTAGG

201 AGCAGCTTGC TTAGCCGCCT TCGCTTTCGA CAACGCCCCC ACAGGCGCTT

251 CCCAAGCGTT GCCTACCGTT ACCGCACCCG TGGCGATTCC CGCGCCCGCT

301 TCGGCAGCCT GA

它对应于氨基酸序列<SEQ ID 38；ORF56-1>：

1 MACTGLMVFP LMVIGILLAS SKPAPFLTLL LNPVFHASSC VSRWAIRNKI

51 CCSALAKFAK LFIVSLGAAC LAAFAFDNAP TGASQALPTV TAPVAIPAPA

101 SAA*

该氨基酸序列的计算机分析预计了一个前导肽(下划线)，并提示ORF56可能是膜蛋白或周质蛋白。

实施例9

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 39>

1 ATGTTCAGTA TTTTAAATGT GTTTCTTCAT TGTATTCTGG CTTGTGTAGT

51 CTCTGGTGAG ACGCCTACTA TATTTGGTAT CCTTGCTCTT TTTTACTTAT

101 TGTATCTTTC TTATCTTGCT GTTTTTAAGA TTTTCTTTTC TTTTTTCTTA

151 GACAGAGTTT CACTCCGGTC TCCCAGGCTG GAGTGCAAAT GGCATGACCC

201 TTTGGCTCAC TGGCTCACGG CCACTTCTGC TATTCTGCCG CCTCAGCCTC

251 CAGGG

它对应于氨基酸序列<SEQ ID 40；ORF63>：

1 M FSILNVFLH CILACVVSGE TPTIFGILAL FYLLYLSYLA VFKIFFSFFL

51 DRVSLRSPRL ECKWHDPLAH WLTATSAILP PQPPG...

该氨基酸序列的计算机分析预计了一个跨膜区。

根据该分析，预计脑膜炎奈瑟氏球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原。

实施例10

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 41>

1 ..GTGCGGACGT GGTTGGTTTT TTGGTTGCAG CGTTTGAAAT ACCCGTTGTT

51 GCTTTGGATT GCGGATATGT TGCTGTACCG GTTGTTGGGC GGCGCGGAAA

101 TCGAATGCGG CCGTTGCCCT GTGCCGCCGA TGACGGATTG GCAGCATTTT

151 TTGCCGGCGA TGGGAACGGT GTCGGCTTGG GTGGCGGTGA TTTGGGCATA

201 CCTGATGATT GAAAGTGAAA AAAACGGAAG ATATTGA

它对应于氨基酸序列<SEQ ID 42；ORF69>：

1 ..VRTWLVFWLQ RLKYPLLLWI ADMLLYRLLG GAEIECGRCP VPPMTDWQHF

51 LPA MGTVSAW VAVIWAYLMI ESEKNGRY*

该氨基酸序列的计算机分析预计了一个跨膜区。

还鉴定了脑膜炎奈瑟氏球菌菌株A的相应ORF：

与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性

ORF69显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF69a)重叠的78个氨基酸内有96.2％的相同性：

10 20 30 40 50 60

orf69.pep VRTWLVFWLQRLKYP LLLWIADMLLYRLLGGAEIECGRCPVPPMTDWQHFLPA MGTVSAW

||||||||||||||| ||| ||||||||||||| ||||||||||||||||||||: ||||:||

orf69a VRTWLVFWLQRLKYP LLLCIADMLLYRLLGGAEIECGRCPVPPMTDWQHFLPT MGTVAAW

10 20 30 40 50 60

70 79

orf69.pep VAVIWAYLMIESEKNGRYX

|||||||||| |||||||||

orf69a VAVIWAYLMIESEKNGRYX

70

ORF69a的核苷酸序列<SEQ ID 43>是：

1 GTGCGGACGT GGTTGGTTTT TTGGTTGCAG CGTTTGAAAT ACCCGTTGTT

51 GCTTTGTATT GCGGATATGC TGCTGTACCG GTTGTTGGGC GGCGCGGAAA

101 TCGAATGCGG CCGTTGCCCT GTACCGCCGA TGACGGATTG GCAGCATTTT

151 TTGCCGACGA TGGGAACGGT GGCGGCTTGG GTGGCGGTGA TTTGGGCATA

201 CCTGATGATT GAAAGTGAAA AAAACGGAAG ATATTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 44>：

1 VRTWLVFWLQ RLKYP LLLCI ADMLLYRLLG GAEIECGRCP VPPMTDWQHF

51 LPT MGTVAAW VAVIWAYLMI ESEKNGRY*

实施例11

在脑膜炎奈瑟氏球菌中鉴定出下列DNA序列<SEQ ID 45>

1 ATGTTTCAAA ATTTTGATTT GGGCGTGTTC CTGCTTGCCG TCCTCCCCGT

51 GCTGCCCTCC ATTACCGTCT CGCACGTGGC GCGCGGCTAT ACGGCGCGCT

101 ACTGGGGAGA CAACACTGCC GAACAATACG GCAGGCTGAC ACTGAACCCC

151 CTGCCCCATA TCGATTTGGT CGGCACAATC ATCgTACCGC TGCTTACTTT

201 GATGTTCACG CCCTTCCTGT TCGGCTGGGC GCGTCCGATT CCTATCGATT

251 CGCGCAACTT CCGCAACCCG cGCCTTGCCT GGCGTTGCGT TGCCGCGTCC

301 GGCCCGCTGT CGAATCTAGC GATGGCTGTw CTGTGGGGCG TGGTTTTGGT

351 GCTGACTCCG TATGTCGGCG GGGCGTATCA GATGCCGTTG GCTCAAATGG

401 CAAACTACGG TATTCTGATC AATGCGATTC TGTTCGCGCT CAACATCATC

451 CCCATCCTGC CTTGGGACGG CGGCATTTTC ATCGACACCT TCCTGTCGGC

501 GAAATATTCG CAAGCGTTCC GCAAAATCGA ACCTTATGGG ACGTGGATTA

551 TCCTACTGCT GATGCTGACC sGGGTTTTGG GTGCGTTTAT wGCACCGATT

601 sTGCGGmTGc GTGATTGCrT TTGTGCAGAT GTwCGTCTGA CTGGCTTTCA

651 GACGGCATAA

它对应于氨基酸序列<SEQ ID 46；ORF77>：

1 MFQNFDLGVF LLAVLPVLPS ITVSHVARGY TARYWGDNTA EQYGRLTLNP

51 LP HIDLVGTI IVPLLTLMFT PFLFGWARPI PIDSRNFRNP RLAWRCVAAS

101 GP LSNLAMAV LWGVVLVLTP YVGGAYQMPL AQ MANYGILI NAILFALNII

151 PILPWDGGIF IDTFLSAKYS QAFRKIEPY G TWIILLLMLT XVLGAFIAPI

201 XRXRDCXCAD VRLTGFQTA*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 47>：

1 ATGTTTCAAA ATTTTGATTT GGGCGTGTTT CTGCTTGCCG TCCTGCCCGT

51 GCTGCTCTCC ATTACCGTCA GGGAGGTGGC GCGCGGCTAT ACGGCGCGCT

101 ACTGGGGAGA CAACACTGCC GAACAATACG GCAGGCTGAC ACTGAACCCC

151 CTGCCCCATA TCGATTTGGT CGGCACAATC ATCGTACCGC TGCTTACTTT

201 GATGTTCACG CCCTTCCTGT TCGGCTGGGC GCGTCCGATT CCTATCGATT

251 CGCGCAACTT CCGCAACCCG CGCCTTGCCT GGCGTTGCGT TGCCGCGTCC

301 GGCCCGCTGT CGAATCTAGC GATGGCTGTT CTGTGGGGCG TGGTTTTGGT

351 GCTGACTCCG TATGTCGGCG GGGCGTATCA GATGCCGTTG GCTCAAATGG

401 CAAACTACGG TATTCTGATC AATGCGATTC TGTTCGCGCT CAACATCATC

451 CCCATCCTGC CTTGGGACGG CGGCATTTTC ATCGACACCT TCCTGTCGGC

501 GAAATATTCG CAAGCGTTCC GCAAAATCGA ACCTTATGGG ACGTGGATTA

551 TCCTACTGCT GATGCTGACC GGGGTTTTGG GTGCGTTTAT TGCACCGATT

601 GTGCGGCTGG TGATTGCGTT TGTGCAGATG TTCGTCTGA

它对应于氨基酸序列<SEQ ID 48；ORF77-1>：

1 MFQNFDLGVF LLAVLPVLLS ITVREVARGY TARYWGDNTA EQYGR LTLNP

51 LPHIDLVGTI IVPLLTLMFT PFLFGWARPI PIDSRNFRNP RLAWRCVAAS

101 GPLSN LAMAV LWGVVLVLTP YVGGAYQMPL AQMANY GILI NAILFALNII

151 PILPWDGGIF IDTFLSAKYS QAFRKIEPY G TWIILLLMLT GVLGAFIAPI

201 VRLVIAFVQM FV*

该氨基酸序列的计算机分析揭示一个推定的前导序列和数个跨膜结构域。

还鉴定了脑膜炎奈瑟氏球菌菌株A的一个相应的ORF：

与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性

ORF77显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF77a)在重叠的173个氨基酸内有96.5％的相同性：

10 20 30 40 50 60

orf77.pep MFQNFDLGVFLLAVLPVLPSITVSHVARGYTARYWGDNTAEQYGR LTLNPLPHIDLVGTI

|||||||||||||||||| |||||||||||||||

orf77a RGYTARYWGDNTAEQYGR LTLNPLPHIDLVGTI

10 20 30

70 80 90 100 110 120

orf77.pep IVPLLTLMFTPFLFGWARPIPIDSRNFRNPRLAWRCVAASGPLSN LAMAVLWGVVLVLTP

|| ||||||||||||||||||||||||||||||||||||||||||| |||||||||||||||

orf77a IVPLLTLMFTPFLFGWARPIPIDSRNFRNPRLAWRCVAASGPLSN LAMAVLWGVVLVLTP

40 50 60 70 80 90

130 140 150 160 170 180

orf77.pep YVGGAYQMPLAQMANY GILINAILFALNIIPILPWDGGIFIDTFLSAKYSQAFRKIEPY G

|| |||||||||||||| ||||||| |||||||| | ||||||||||||| |||||||||||

orf77a YVGGAYQMPLAQMANY XILINAILXALNIIPILPWDGGIFIDTFLSAKXSQAFRKIEPY G

100 110 120 130 140 150

190 200 210 220

orf77.pep TWIILLLMLTXVLGAFIAPIXRXRDCXCADVRLTGFQTAX

||| |||||| |||| ||||

orf77a TWIIXLLMLTGVLGAXIAPIVQLVIAFVQMFVX

160 170 180

ORF77-1和ORF77a显示在185个重叠的氨基酸内有96.8％的相同性：

10 20 30 40 50 60

orf77-1.pep MFQNFDLGVFLLAVLPVLLSITVREVARGYTARYWGDNTAEQYGRLTLNPLPHIDLVGTI

|||||||||||||||||||||||||||||||||

orf77a RGYTARYWGDNTAEQYGRLTLNPLPHIDLVGTI

10 20 30

70 80 90 100 110 120

orf77-1.pep IVPLLTLMFTPFLFGWARPIPIDSRNFRNPRLAWRCVAASGPLSNLAMAVLWGVVLVLTP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf77a IVPLLTLMFTPFLFGWARPIPIDSRNFRNPRLAWRCVAASGPLSNLAMAVLWGVVLVLTP

40 50 60 70 80 90

130 140 150 160 170 180

orf77-1.pep YVGGAYQMPLAQMANYGILINAILFALNIIPILPWDGGIFIDTFLSAKYSQAFRKIEPYG

|||||||||||||||| ||||||| ||||||||||||||||||||||| |||||||||||

orf77a YVGGAYQMPLAQMANYXILINAILXALNIIPILPWDGGIFIDTFLSAKXSQAFRKIEPYG

100 110 120 130 140 150

190 200 210

orf77-1.pep TWIILLLMLTGVLGAFIAPIVRLVIAFVQMFVX

|||| |||||||||| |||||:|||||||||||

orf77a TWIIXLLMLTGVLGAXIAPIVQLVIAFVQMFVX

160 170 180

鉴定了ORF77a的部分核苷酸序列<SEQ ID 49>：

1 ..CGCGGCTATA CAGCGCGCTA CTGGGGTGAC AACACTGCCG AACAATACGG

51 CAGGCTGACA CTGAACCCCC TGCCCCATAT CGATTTGGTC GGCACAATCA

101 TCGTACCGCT GCTTACTTTG ATGTTTACGC CCTTCCTGTT CGGCTGGGCG

151 CGTCCGATTC CTATCGATTC GCGCAACTTC CGCAACCCGC GCCTTGCCTG

201 GCGTTGCGTT GCCGCGTCCG GCCCGCTGTC GAATCTGGCG ATGGCTGTTC

251 TGTGGGGCGT GGTTTTGGTG CTGACTCCGT ATGTCGGTGG GGCGTATCAG

301 ATGCCGTTGG CNCAAATGGC AAACTACNNN ATTCTGATCA ATGCGATTCT

351 GTNCGCGCTC AACATCATCC CCATCCTGCC TTGGGACGGC GGCATTTTCA

401 TCGACACCTT CCTGTCGGCN AAATANTCGC AAGCGTTCCG CAAAATCGAA

451 CCTTATGGGA CGTGGATTAT CCNGCTGCTT ATGCTGACCG GGGTTTTGGG

501 TGCGTNTATT GCACCGATTG TGCAGCTGGT GATTGCGTTT GTGCAGATGT

551 TCGTCTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 50>：

1 ..RGYTARYWGD NTAEQYGR LT LNPLPHIDLV GTIIVPLLTL MFTPFLFGWA

51 RPIPIDSRNF RNPRLAWRCV AASGPLSN LA MAVLWGVVLV LTPYVGGAYQ

101 MPLAQMANY X ILINAILXAL NIIPILPWDG GIFIDTFLSA KXSQAFRKIE

151 PY GTWIIXLL MLTGVLGAXI APIVQLVIAF VQMFV*

实施例12

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 51>

1 ATGAACCTGA TTTCACGTTA CATCATCCGT CAAATGGCGG TTATGGCGGT

51 TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT

101 ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGCTG

151 GGCTACACCG CCCTCAAAAT GCCCGCCCGC GCCTACGAAC TGATTCCCCT

201 CGCCGTCCTT ATCGGCGGAC TGGTCTCCCT CAGCCAGCTT GCCGCCGGCA

251 GCGAACTGAC CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG

301 TTGATTCTGT CGCAGTTCGG TTTTATTTTT GCTATTGCCA CCGTCGCGCT

351 CGGCGAATGG GTTGCGCCCA CACTGAGCCA AAAAGCCGAA AACATCAAAG

401 CCGCCGCCAT CAACGGCAAA ATCAGCACCG GCAATACCGG CCTTTGGCTG

451 AAAGAAAAAA ACAGCGTGAT CAATGTGCGC GAAATGTTGC CCGACCAT..

它对应于氨基酸序列<SEQ ID 52；ORF112>：

1 MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEML

51 GYTALKMPAR AYE LIPLAVL IGGLVSLSQL AAGSELTVIK ASGMSTKK LL

101 LILSQFGFIF AIATVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL

151 KEKNSVINVR EMLPDH...

进一步的工作进一步揭示了部分核苷酸序列<SEQ ID 53>：

1 ATGAACCTGA TTTCACGTTA CATCATCCGT CAAATGGCGG TTATGGCGGT

51 TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT

101 ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGCTG

151 gGCTACACCG CCCTCAAAAT GCCCGCCCGC GCCTACGAAC TGATTCCCCT

201 CGCCGTCCTT ATCGGCGGAC TGGTCTCCCT CAGCCAGCTT GCCGCCGGCA

251 GCGAACTGAC CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG

301 TTGATTCTGT CGCAGTTCGG TTTTATTTTT GCTATTGCCA CCGTCGCGCT

351 CGGCGAATGG GTTGCGCCCA CACTGAGCCA AAAAGCCGAA AACATCAAAG

401 CCGCCGCCAT CAACGGCAAA ATCAGCACCG GCAATACCGG CCTTTGGCTG

451 AAAGAAAAAA ACAGCrTkAT CAATGTGCGC GAAATGTTGC CCGACCATAC

501 GCTTTTGGGC ATCAAAATTT GGGCGCGCAA CGATAAAAAC GAATTGGCAG

551 AGGCAGTGGA AGCCGATTCC GCCGTTTTGA ACAGCGACGG CAGTTGGCAG

601 TTGAAAAACA TCCGCCGCAG CACGCTTGGC GAAGACAAAG TCGAGGTCTC

651 TATTGCGGCT GAAGAAAACT GGCCGATTTC CGTCAAACGC AACCTGATGG

701 ACGTATTGCT CGTCAAACCC GACCAAATGT CCGTCGGCGA ACTGACCACC

751 TACATCCGCC ACCTCCAAAA CAACAGCCAA AACACCCGAA TCTACGCCAT

801 CGCATGGTGG CGCAAATTGG TTTACCCCGC CGCAGCCTGG GTGATGGCGC

851 TCGTCGCCTT TGCCTTTACC CCGCAAACCA CCCGCCACGG CAATATGGGC

901 TTAAAACTCT TCGGCGGCAT CTGTsTCGGA TTGCTGTTCC ACCTTGCCGG

951 ACGGCTCTTT GGGTTTACCA GCCAACTCGG...

它对应于氨基酸序列<SEQ ID 54；ORF112-1>：

1 MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEML

51 GYTALKMPAR AYE LIPLAVL IGGLVSLSQL AAGSELTVIK ASGMSTKK LL

101 LILSQFGFIF AIATVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL

151 KEKNSXINVR EMLPDHTLLG IKIWARNDKN ELAEAVEADS AVLNSDGSWQ

201 LKNIRRSTLG EDKVEVSIAA EENWPISVKR NLMDVLLVKP DQMSVGELTT

251 YIRHLQNNSQ NTRIYAIAWW RK LVYPAAAW VMALVAFAFT PQTTRHGN MG

301 LKLFGGICXG LLFHLAGRLF GFTSQL...

该氨基酸序列的计算机分析预计了两个跨膜结构域。

还鉴定了脑膜炎奈瑟氏球菌菌株A的相应的ORF：

与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性

ORF112显示与脑膜炎奈瑟氏球菌菌株A的ORF(ORF112a)在重叠的166个氨基酸内有96.4％的相同性：

10 20 30 40 50 60

orf112.pep MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR

|||||||||||||||||||||||||||||||||||||||||||||||||| |||||| ||

orf1 12a MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMXGYTALKMXAR

10 20 30 40 50 60

70 80 90 100 110 120

orf112.pep AYELIPLAVLIGGLVSLSQLAAGSELTVIKASGMSTKKLLLILSQFGFIFAIATVALGEW

||||:||||||||||| |||||||||:|||||||||||||||||||||||||||||||||

orf112a AYELMPLAVLIGGLVSXSQLAAGSELXVIKASGMSTKKLLLILSQFGFIFAIATVALGEW

70 80 90 100 110 120

130 140 150 160

orf112.pep VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSVINVREMLPDH

|||||||||||||||||||||||||||||||||||:||||||||||

orf112a VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSIINVREMLPDHTLLGIKIWARNDKN

130 140 150 160 170 180

orf1 12a ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEEXWPISVKRNLMDVLLVKP

190 200 210 220 230 240

ORF112a的部分核苷酸序列是<SEQ ID 55>鉴定为：

1 ATGAACCTGA TTTCACGTTA CATCATCCGT CAAATGGCGG TTATGGCGGT

51 TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT

101 ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGNTG

151 GGNTACACCG CCCTCAAAAT GNCCGCCCGC GCCTACGAAC TGATGCCCCT

201 CGCCGTCCTT ATCGGCGGAC TGGTCTCTNT CAGCCAGCTT GCCGCCGGCA

251 GCGAACTGAN CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG

301 TTGATTCTGT CGCAGTTCGG TTTTATTTTT GCTATTGCCA CCGTCGCGCT

351 CGGCGAATGG GTTGCGCCCA CACTGAGCCA AAAAGCCGAA AACATCAAAG

401 CCGCGGCCAT CAACGGCAAA ATCAGTACCG GCAATACCGG CCTTTGGCTG

451 AAAGAAAAAA ACAGCATTAT CAATGTGCGC GAAATGTTGC CCGACCATAC

501 CCTGCTGGGC ATTAAAATCT GGGCCCGCAA CGATAAAAAC GAACTGGCAG

551 AGGCAGTGGA AGCCGATTCC GCCGTTTTGA ACAGCGACGG CAGTTGGCAG

601 TTGAAAAACA TCCGCCGCAG CACGCTTGGC GAAGACAAAG TCGAGGTCTC

651 TATTGCGGCT GAAGAAAANT GGCCGATTTC CGTCAAACGC AACCTGATGG

701 ACGTATTGCT CGTCAAACCC GACCAAATGT CCGTCGGCGA ACTGACCACC

751 TACATCCGCC ACCTCCAAAN NNACAGCCAA AACACCCGAA TCTACGCCAT

801 CGCATGGTGG CGCAAATTGG TTTACCCCGC CGCAGCCTGG GTGATGGCGC

851 TCGTCGCCTT TGCCTTTACC CCGCAAACCA CCCGCCACGG CAATATGGGC

901 TTAAAANTCT TCGGCGGCAT CTGTCTCGGA TTGCTGTTCC ACCTTGCCGG

951 NCGGCTCTTC NGGTTTACCA GCCAACTCTA CGGCATCCCG CCCTTCCTCG

1001 NCGGCGCACT ACCTACCATA GCCTTCGCCT TGCTCGCCGT TTGGCTGATA

1051 CGCAAACAGG AAAAACGCTA A

它编码的蛋白质具有氨基酸序列<SEQ ID 56>：

1 MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEMX

51 GYTALKMXAR AYE LMPLAVL IGGLVSXSQL AAGSELXVIK ASGMSTKK LL

101 LILSQFGFIF AIATVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL

151 KEKNSIINVR EMLPDHTLLG IKIWARNDKN ELAEAVEADS AVLNSDGSWQ

201 LKNIRRSTLG EDKVEVSIAA EEXWPISVKR NLMDVLLVKP DQMSVGELTT

251 YIRHLQXXSQ NTRIYAIAWW RK LVYPAAAW VMALVAFAFT PQTTRHGN MG

301 L KXFGGICLG LLFHLAGRLF XFTSQLYGIP PFLXGALPTI AFALLAVWLI

351 RKQEKR*

ORF112a和ORF112-1显示在326个重叠的氨基酸内有96.3％的相同性：

orf112a.pep MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMXGYTALKMXAR

||||||||||||||||||||||||||||||||||||||||||||||||| ||||||| ||

orf112-1 MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR

orf112a.pep AYELMPLAVLIGGLVSXSQLAAGSELXVIKASGMSTKKLLLILSQFGFIFAIATVALGEW

||||:||||||||||| |||||||||:|||||||||||||||||||||||||||||||||

orf112-1 AYELIPLAVLIGGLVSLSQLAAGSELTVIKASGMSTKKLLLILSQFGFIFAIATVALGEW

orf112a.pep VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSIINVREMLPDHTLLGIKIWARNDKN

||||||||||||||||||||||||||||||||||| ||||||||||||||||||||||||

orf112-1 VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSXINVREMLPDHTLLGIKIWARNDKN

orf112a.pep ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEEXWPISVKRNLMDVLLVKP

|||||||||||||||||||||||||||||||||||||||||| |||||||||||||||||

orf112-1 ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEENWPISVKRNLMDVLLVKP

orf112a.pep DQMSVGELTTYIRHLQXXSQNTRIYAIAWWRKLVYPAAAWVMALVAFAFTPQTTRHGNMG

|||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf112-1 DQMSVGELTTYIRHLQNNSQNTRIYAIAWWRKLVYPAAAWVMALVAFAFTPQTTRHGNMG

orf112a.pep LKXFGGICLGLLFHLAGRLFXFTSQLYGIPPFLXGALPTIAFALLAVWLIRKQEKRX

|| ||||| ||||||||||| |||||

orf112-1 LKLFGGICXGLLFHLAGRLFGFTSQL

实施例13

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 57>

1 ..GCAGTAGCCG AAACTGCCAA CAGCCAGGGC AAAGGTAAAC AGGCAGGCAG

51 TTCGGTTTCT GTTTCACTGA AAACTTCAGG CGACCTTTGC GGCAAACTCA

101 AAACCACCCT TAAAACTTTG GTCTGCTCTT TGGTTTCCCT GAGTATGGTA

151 TTGCCTGCCC ATGCCCAAAT TACCACCGAC AAATCAGCAC CTAAAAACCA

201 GCAGGTCGTT ATCCTTAAAA CCAACACTGG TGCCCCCTTG GTGAATATCC

251 AAACTCCGAA TGGACGCGGA TTGAGCCACA ACCGCTA.TA CGCATTTGAT

301 GTTGACAACA AAGGGGCAGT GTTAAACAAC GACCGTAACA ATAATCCGTT

351 TGTGGTCAAA GGCAGTGCGC AATTGATTTT GAACGAGGTA CGCGGTACGG

401 CTAGCAAACT CAACGGCATC GTTACCGTAG GCGGTCAAAA GGCCGACGTG

451 ATTATTGCCA ACCCCAACGG CATTACCGTT AATGGCGGCG GCTTTAAAAA

501 TGTCGGTCGG GGCATCTTAA CTACCGGTGC GCCCCAAATC GGCAAAGACG

551 GTGCACTGAC AGGATTTGAT GTG CGTCAAG GCACATTGgA CCGTAGrAGC

601 AGCAGGTTGG AATGATAAAG GCGGAGCmrm yTACACCGGG GTACTTGCTC

651 GTGCAGTTGC TTTGCAGGGG AAATTwmmGG GTAAA.AACT GGCGGTTTCT

701 ACCGGTCCTC AGAAAGTAGA TTACGCCAGC GGCGAAATCA GTGCAGGTAC

751 GGCAGCGGGT ACGAAACCGA CTATTGCCCT TGATACTGCC GCACTGGGCG

801 GTATGTACGC CGACAGCATC ACACTGATTG CCAATGAAAA AGGCGTAGGC

851 GTCTAA

它对应于氨基酸序列<SEQ ID 58；ORF114>：

1 ..AVAETANSQG KGKQAGSSVS VSLKTSGDLC GKLKTT LKTL VCSLVSLSMV

51 LPAHAQITTD KSAPKNQQVV ILKTNTGAPL VNIQTPNGRG LSHNRXYAFD

101 VDNKGAVLNN DRNNNPFVVK GSAQLILNEV RGTASKLNGI VTVGGQKADV

151 IIANPNGITV NGGGFKNVGR GILTTGAPQI GKDGALTGFD VVKAHWTVXA

201 AGWNDKGGAX YTGVLARAVA LQGKXXGKXL AVSTGPQKVD YASGEISAGT

251 AAGTKPTIAL DTAALGGMYA DSITLIANEK GVGV*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 59>：

1 ATGAATAAAG GTTTACATCG CATTATCTTT AGTAAAAAGC ACAGCACCAT

51 GGTTGCAGTA GCCGAAACTG CCAACAGCCA GGGCAAAGGT AAACAGGCAG

101 GCAGTTCGGT TTCTGTTTCA CTGAAAACTT CAGGCGACCT TTGCGGCAAA

151 CTCAAAACCA CCCTTAAAAC TTTGGTCTGC TCTTTGGTTT CCCTGAGTAT

201 GGTATTGCCT GCCCATGCCC AAATTACCAC CGACAAATCA GCACCTAAAA

251 ACCAGCAGGT CGTTATCCTT AAAACCAACA CTGGTGCCCC CTTGGTGAAT

301 ATCCAAACTC CGAATGGACG CGGATTGAGC CACAACCGCT ATACGCAGTT

351 TGATGTTGAC AACAAAGGGG CAGTGTTAAA CAACGACCGT AACAATAATC

401 CGTTTGTGGT CAAAGGCAGT GCGCAATTGA TTTTGAACGA GGTACGCGGT

451 ACGGCTAGCA AACTCAACGG CATCGTTACC GTAGGCGGTC AAAAGGCCGA

501 CGTGATTATT GCCAACCCCA ACGGCATTAC CGTTAATGGC GGCGGCTTTA

551 AAAATGTCGG TCGGGGCATC TTAACTACCG GTGCGCCCCA AATCGGCAAA

601 GACGGTGCAC TGACAGGATT TGATGTGCGT CAAGGCACAT TGACCGTAGG

651 AGCAGCAGGT TGGAATGATA AAGGCGGAGC CGACTACACC GGGGTACTTG

701 CTCGTGCAGT TGCTTTGCAG GGGAAATTAC AGGGTAAAAA CCTGGCGGTT

751 TCTACCGGTC CTCAGAAAGT AGATTACGCC AGCGGCGAAA TCAGTGCAGG

801 TACGGCAGCG GGTACGAAAC CGACTATTGC CCTTGATACT GCCGCACTGG

851 GCGGTATGTA CGCCGACAGC ATCACACTGA TTGCCAATGA AAAAGGCGTA

901 GGCGTCAAAA ATGCCGGCAC ACTCGAAGCG GCCAAGCAAT TGATTGTGAC

951 TTCGTCAGGC CGCATTGAAA ACAGCGGCCG CATCGCCACC ACTGCCGACG

1001 GCACCGAAGC TTCACCGACT TATCTCTCCA TCGAAACCAC CGAAAAAGGA

1051 GCGGCAGGCA CATTTATCTC CAATGGTGGT CGGATCGAGA GCAAAGGCTT

1101 ATTGGTTATT GAGACGGGAG AAGATATCAG CTTGCGTAAC GGAGCCGTGG

1151 TGCAGAATAA CGGCAGTCGC CCAGCTACCA CGGTATTAAA TGCTGGTCAT

1201 AATTTGGTGA TTGAGAGCAA AACTAATGTG AACAATGCCA AAGGCCCGGC

1251 TACTCTGTCG GCCGACGGCC GTACCGTCAT CAAGGAGGCC AGTATTCAGA

1301 CTGGCACTAC CGTATACAGT TCCAGCAAAG GCAACGCCGA ATTAGGCAAT

1351 AACACACGCA TTACCGGGGC AGATGTTACC GTATTATCCA ACGGCACCAT

1401 CAGCAGTTCC GCCGTAATAG ATGCCAAAGA CACCGCACAC ATCGAAGCAG

1451 GCAAACCGCT TTCTTTGGAA GCTTCAACAG TTACCTCCGA TATCCGCTTA

1501 AACGGAGGCA GTATCAAGGG CGGCAAGCAG CTTGCTTTAC TGGCAGACGA

1551 TAACATTACT GCCAAAACTA CCAATCTGAA TACTCCCGGC AATCTGTATG

1601 TTCATACAGG TAAAGATCTG AATTTGAATG TTGATAAAGA TTTGTCTGCC

1651 GCCAGCATCC ATTTGAAATC GGATAACGCT GCCCATATTA CCGGCACCAG

1701 TAAAACCCTC ACTGCCTCAA AAGACATGGG TGTGGAGGCA GGCTCGCTGA

1751 ATGTTACCAA TACCAATCTG CGTACCAACT CGGGTAATCT GCACATTCAG

1801 GCAGCCAAAG GCAATATTCA GCTTCGCAAT ACCAAGCTGA ACGCAGCCAA

1851 GGCTCTCGAA ACCACCGCAT TGCAGGGCAA TATCGTTTCA GACGGCCTTC

1901 ATGCTGTTTC TGCAGACGGT CATGTATCCT TATTGGCCAA CGGTAATGCC

1951 GACTTTACCG GTCACAATAC CCTGACAGCC AAGGCCGATG TCAATGCAGG

2001 ATCGGTTGGT AAAGGCCGTC TGAAAGCAGA CAATACCAAT ATCACTTCAT

2051 CTTCAGGAGA TATTACGTTG GTTGCCGGCA ACGGTATTCA GCTTGGTGAC

2101 GGAAAACAAC GCAATTCAAT CAACGGAAAA CACATCAGCA TCAAAAACAA

2151 CGGTGGTAAT GCCGACTTAA AAAACCTTAA CGTCCATGCC AAAAGCGGGG

2201 CATTGAACAT TCATTCCGAC CGGGCATTGA GCATAGAAAA TACCAAGCTG

2251 GAGTCTACCC ATAATACGCA TCTTAATGCA CAACACGAGC GGGTAACGCT

2301 CAACCAAGTA GATGCCTACG CACACCGTCA TCTAAGCATT ACCGGCAGCC

2351 AGATTTGGCA AAACGACAAA CTGCCTTCTG CCAACAAGCT GGTGGCTAAC

2401 GGTGTATTGG CACTCAATGC GCGCTATTCC CAAATTGCCG ACAACACCAC

2451 GCTGAGAGCG GGTGCAATCA ACCTTACTGC CGGTACCGCC CTAGTCAAGC

2501 GCGGCAACAT CAATTGGAGT ACCGTTTCGA CCAAAACTTT GGAAGATAAT

2551 GCCGAATTAA AACCATTGGC CGGACGGCTG AATATTGAAG CAGGTAGCGG

2601 CACATTAACC ATCGAACCTG CCAACCGCAT CAGTGCGCAT ACCGACCTGA

2651 GCATCAAAAC AGGCGGAAAA TTGCTGTTGT CTGCAAAAGG AGGAAATGCA

2701 GGTGCGCCTA GTGCTCAAGT TTCCTCATTG GAAGCAAAAG GCAATATCCG

2751 TCTGGTTACA GGAGAAACAG ATTTAAGAGG TTCTAAAATT ACAGCCGGTA

2801 AAAACTTGGT TGTCGCCACC ACCAAAGGCA AGTTGAATAT CGAAGCCGTA

2851 AACAACTCAT TCAGCAATTA TTTTCCTACA CAAAAAGCGG CTGAACTCAA

2901 CCAAAAATCC AAAGAATTGG AACAGCAGAT TGCGCAGTTG AAAAAAAGCT

2951 CGCCTAAAAG CAAGCTGATT CCAACCCTGC AAGAAGAACG CGACCGTCTC

3001 GCTTTCTATA TTCAAGCCAT CAACAAGGAA GTTAAAGGTA AAAAACCCAA

3051 AGGCAAAGAA TACCTGCAAG CCAAGCTTTC TGCACAAAAT ATTGACTTGA

3101 TTTCCGCACA AGGCATCGAA ATCAGCGGTT CCGATATTAC CGCTTCCAAA

3151 AAACTGAACC TTCACGCCGC AGGCGTATTG CCAAAGGCAG CAGATTCAGA

3201 GGCGGCTGCT ATTCTGATTG ACGGCATAAC CGACCAATAT GAAATTGGCA

3251 AGCCCACCTA CAAGAGTCAC TACGACAAAG CTGCTCTGAA CAAGCCTTCA

3301 CGTTTGACCG GACGTACAGG GGTAAGTATT CATGCAGCTG CGGCACTCGA

3351 TGATGCACGT ATTATTATCG GTGCATCCGA AATCAAAGCT CCCTCAGGCA

3401 GCATAGACAT CAAAGCCCAT AGTGATATTG TACTGGAGGC TGGACAAAAC

3451 GATGCCTATA CCTTCTTAAA AACCAAAGGT AAAAGCGGCA AAATCATCAG

3501 AAAAACCAAG TTTACCAGCA CCCGCGACCA CCTGATTATG CCAGCCCCCG

3551 TCGAGCTGAC CGCCAACGGC ATAACGCTTC AGGCAGGCGG CAACATCGAA

3501 GCTAATACCA CCCGCTTCAA TGCCCCTGCA GGTAAAGTTA CCCTGGTTGC

3651 GGGTGAAGAG CTGCAACTGC TGGCAGAAGA AGGCATCCAC AAGCACGAGT

3701 TGGATGTCCA AAAAAGCCGC CGCTTTATCG GCATCAAGGT AGGCAAGAGC

3751 AATTACAGTA AAAACGAACT GAACGAAACC AAATTGCCTG TCCGCGTCGT

3801 CGCCCAAACT GCAGCCACCC GTTCAGGCTG GGATACCGTG CTCGAAGGTA

3851 CCGAATTCAA AACCACGCTG GCCGGTGCGG ACATTCAGGC AGGTGTAGGC

3901 GAAAAAGCCC GTGCCGATGC GAAAATTATC CTCAAAGGCA TTGTGAACCG

3951 TATCCAGTCG GAAGAAAAAT TAGAAACCAA CTCAACCGTA TGGCAGAAAC

4001 AGGCCGGACG CGGCAGCACT ATCGAAACGC TGAAACTGCC CAGCTTCGAA

4051 AGCCCTACTC CGCCCAAACT GACCGCCCCC GGTGGCTATA TCGTCGACAT

4101 TCCGAAAGGC AATTTGAAAA CCGAAATCGA AAAGCTGGCC AAACAGCCCG

4151 AGTATGCCTA TCTGAAACAG CTCCAAGTAG CGAAAAACGT CAACTGGAAC

4201 CAGGTGCAAC TGGCTTACGA TAAATGGGAC TATAAGCAGG AAGGCTTAAC

4251 CAGAGCCGGT GCAGCGATTG TTACCATAAT CGTAACCGCA CTGACTTATG

4301 GATACGGCGC AACCGCAGCG GGCGGTGTAG CCGCTTCAGG AAGTAGTACA

4351 GCCGCAGCTG CCGGAACAGC CGCCACAACG ACAGCAGCAG CTACTACCGT

4401 TTCTACAGCG ACTGCCATGC AAACCGCTGC TTTAGCCTCC TTGTATAGCC

4451 AAGCAGCTGT ATCCATCATC AATAATAAAG GTGATGTCGG CAAAGCGTTG

4501 AAAGATCTCG GCACCAGTGA TACGGTCAAG CAGATTGTCA CTTCTGCCCT

4551 GACGGCGGGT GCATTAAATC AGATGGGCGC AGATATTGCC CAATTGAACA

4601 GCAAGGTAAG AACCGAACTG TTCAGCAGTA CGGGCAATCA AACTATTGCC

4651 AACCTTGGAG GCAGACTGGC TACCAATCTC AGTAATGCAG GTATCTCAGC

4701 TGGTATCAAT ACCGCCGTCA ACGGCGGCAG CCTGAAAGAC AACTTAGGCA

4751 ATGCCGCATT AGGAGCATTG GTTAATAGCT TCCAAGGAGA AGCCGCCAGC

4801 AAAATCAAAA CAACCTTCAG CGACGATTAT GTTGCCAAAC AGTTCGCCCA

4851 CGCTTTGGCT GGGTGTGTTA GCGGATTGGT ACAAGGAAAA TGTAAAGACG

4901 GGGCAATTGG CGCAGCAGTT GGGGAAATCG TAGCCGACTC CATGCTTGGC

4951 GGCAGAAACC CTGCTACACT CAGCGATGCG GAAAAGCATA AGGTTATCAG

5001 TTACTCGAAG ATTATTGCCG GCAGCGTGGC GGCACTCAAC GGCGGCGATG

5051 TGAATACTGC GGCGAATGCG GCTGAGGTGG CGGTAGTGAA TAATGCTTTG

5101 AATTTTGACA GTACCCCTAC CAATGCGAAA AAGCATCAAC CGCAGAAGCC

5151 CGACAAAACC GCACTGGAAA AAATTATCCA AGGTATTATG CCTGCACATG

5201 CAGCAGGTGC GATGACTAAT CCGCAGGATA AGGATGCTGC CATTTGGATA

5251 AGCAATATCC GTAATGGCAT CACAGGCCCG ATTGTGATTA CCAGCTATGG

5301 GGTTTATGCT GCAGGTTGGA CAGCTCCGCT GATCGGTACA GCGGGTAAAT

5351 TAGCTATCAG CACCTGCATG GCTAATCCTT CTGGTTGTAC TGTCATGGTC

5401 ACTCAGGCTG CCGAAGCGGG CGCGGGAATC GCCACGGGTG CGGTAACGGT

5451 AGGCAACGCT TGGGAAGCGC CTGTGGGGGC GTTGTCGAAA GCGAAGGCGG

5501 CCAAGCAGGC TATACCAACC CAGACAGTTA AAGAACTTGA TGGCTTACTA

5551 CAAGAATCAA AAAATATAGG TGCTGTAAAT ACACGAATTA ATATAGCGAA

5601 TAGTACTACT CGATATACAC CAATGAGACA AACGGGACAA CCGGTATCTG

5651 CTGGCTTTGA GCATGTTCTT GAGGGGCACT TCCATAGGCC TATTGCGAAT

5701 AACCGTTCAG TTTTTACCAT CTCCCCAAAT GAATTGAAGG TTATACTTCA

5751 AAGTAATAAA GTAGTTTCTT CTCCCGTATC GATGACTCCT GATGGCCAAT

5801 ATATGCGGAC TGTCGATGTA GGAAAAGTTA TTGGTACTAC TTCTATTAAA

5851 GAAGGTGGAC AACCCACAAC TACAATTAAA GTATTTACAG ATAAGTCAGG

5901 AAATTTGATT ACTACATACC CAGTAAAAGG AAACTAA

它对应于氨基酸序列<SEQ ID 60；ORF114-1>：

1 MNKGLHRIIF SKKHSTMVAV AETANSQGKG KQAGSSVSVS LKTSGDLCGK

51 LKTTLKTLVC SLVSLSMVLP AHAQITTDKS APKNQQVVIL KTNTGAPLVN

101 IQTPNGRGLS HNRYTQFDVD NKGAVLNNDR NNNPFVVKGS AQLILNEVRG

151 TASKLNGIVT VGGQKADVII ANPNGITVNG GGFKNVGRGI LTTGAPQIGK

201 DGALTGFDVR QGTLTVGAAG WNDKGGADYT GVLARAVALQ GKLQGKNLAV

251 STGPQKVDYA SGEISAGTAA GTKPTIALDT AALGGMYADS ITLIANEKGV

301 GVKNAGTLEA AKQLIVTSSG RIENSGRIAT TADGTEASPT YLSIETTEKG

351 AAGTFISNGG RIESKGLLVI ETGEDISLRN GAVVQNNGSR PATTVLNAGH

401 NLVIESKTNV NNAKGPATLS ADGRTVIKEA SIQTGTTVYS SSKGNAELGN

451 NTRITGADVT VLSNGTISSS AVIDAKDTAH IEAGKPLSLE ASTVTSDIRL

501 NGGSIKGGKQ LALLADDNIT AKTTNLNTPG NLYVHTGKDL NLNVDKDLSA

551 ASIHLKSDNA AHITGTSKTL TASKDMGVEA GSLNVTNTNL RTNSGNLHIQ

601 AAKGNIQLRN TKLNAAKALE TTALQGNIVS DGLHAVSADG HVSLLANGNA

651 DFTGHNTLTA KADVNAGSVG KGRLKADNTN ITSSSGDITL VAGNGIQLGD

701 GKQRNSINGK HISIKNNGGN ADLKNLNVHA KSGALNIHSD RALSIENTKL

751 ESTHNTHLNA QHERVTLNQV DAYAHRHLSI TGSQIWQNDK LPSANKLVAN

801 GVLALNARYS QIADNTTLRA GAINLTAGTA LVKRGNINWS TVSTKTLEDN

851 AELKPLAGRL NIEAGSGTLT IEPANRISAH TDLSIKTGGK LLLSAKGGNA

901 GAPSAQVSSL EAKGNIRLVT GETDLRGSKI TAGKNLVVAT TKGKLNIEAV

951 NNSFSNYFPT QKAAELNQKS KELEQQIAQL KKSSPKSKLI PTLQEERDRL

1001 AFYIQAINKE VKGKKPKGKE YLQAKLSAQN IDLISAQGIE ISGSDITASK

1051 KLNLHAAGVL PKAADSEAAA ILIDGITDQY EIGKPTYKSH YDKAALNKPS

1101 RLTGRTGVSI HAAAALDDAR IIIGASEIKA PSGSIDIKAH SDIVLEAGQN

1151 DAYTFLKTKG KSGKIIRKTK FTSTRDHLIM PAPVELTANG ITLQAGGNIE

1201 ANTTRFNAPA GKVTLVAGEE LQLLAEEGIH KHELDVQKSR RFIGIKVGKS

1251 NYSKNELNET KLPVRVVAQT AATRSGWDTV LEGTEFKTTL AGADIQAGVG

1301 EKARADAKII LKGIVNRIQS EEKLETNSTV WQKQAGRGST IETLKLPSFE

1351 SPTPPKLTAP GGYIVDIPKG NLKTEIEKLA KQP EYAYLKQ LQVAKNVNWN

1401 QVQLAYDKWD YKQEGLTRAG AAIVTIIVTA LTYGYGATAA GGVAASGSST

1451 AAAAGTAATT TAAATTVSTA TAMQTAALAS LYSQAAVSII NNKGDVGKAL

1501 KDLGTSDTVK QIVTSALTAG ALNQMGADIA QLNSKVRTEL FSSTGNQTIA

1551 NLGGRLATNL SNAGISAGIN TAVNGGSLKD NLGNAALGAL VNSFQGEAAS

1601 KIKTTFSDDY VAKQFAHALA GCVSGLVQGK CKDGAIGAAV GEIVADSMLG

1651 GRNPATLSDA EKHKVISYSK IIAGSVAALN GGDVNTAANA AEVAVVNNAL

1701 NFDSTPTNAK KHQPQKPDKT ALEKIIQGIM PAHAAGAMTN PQDKDAAIWI

1751 SNIRNGITGP IVITSYGVYA AGWTAPLIGT AGKLAISTCM ANPSGCTVMV

1801 TQAAEAGAGI ATGAVTVGNA WEAPVGALSK AKAAKQAIPT QTVKELDGLL

1851 QESKNIGAVN TRINIANSTT RYTPMRQTGQ PVSAGFEHVL EGHFHRPIAN

1901 NRSVFTISPN ELKVILQSNK VVSSPVSMTP DGQYMRTVDV GKVIGTTSIK

1951 EGGQPTTTIK VFTDKSGNLI TTYPVKGN*

该氨基酸序列的计算机分析预计了一个跨膜区，还给出了下列结果：

与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性

ORF114显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF114a)重叠的284个氨基酸内有91.9％的相同性：

10 20 30 40

orf114.pep AVAETANSQGKGKQAGSSVSVSLKTSGDLCGKLKTTLKTLVC

||||||||||||||||||||||||||||||||||||||||||

orf114a MNKGLHRIIFSKKHSTMVAVAETANSQGKGKQAGSSVSVSLKTSGDLCGKLKTTLKTLVC

10 20 30 40 50 60

50 60 70 80 90 100

orf114.pep SLVSLSMVLPAHAQITTDKSAPKNQQVVILKTNTGAPLVNIQTPNGRGLSHNRXYAFDVD

||||||| ||||||||||| |||||||||||||||||||||||||||| ||||

orf114a SLVSLSMXXXXXXQITTDKSAPKNXQVVILKTNTGAPLVNIQTPNGRGLSHNRYTQFDVD

70 80 90 100 110 120

110 120 130 140 150 160

orf114.pep NKGAVLNNDRNNNPFVVKGSAQLILNEVRGTASKLNGIVTVGGQKADVIIANPNGITVNG

|||||||||||||||:||||||||||||||||||||||||||||||||||||||||||||

orf114a NKGAVLNNDRNNNPFLVKGSAQLILNEVRGTASKLNGIVTVGGQKADVIIANPNGITVNG

130 140 150 160 170 180

170 180 190 200 210 220

orf114.pep GGFKNVGRGILTTGAPQIGKDGALTGFDVVKAHWTVXAAGWNDKGGAXYTGVLARAVALQ

|||||||||||| |||||||||||||||| :: || |||||||||| ||||||||||||

orf114a GGFKNVGRGILTIGAPQIGKDGALTGFDVRQGTLTVGAAGWNDKGGADYTGVLARAVALQ

190 200 210 220 230 240

230 240 250 260 270 280

orf114.pep GKXXGKXLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIANEKGV

|| || |||||||||||||||||||||||||||||||||||||||||||||||| ||||

orf114a GKLQGKNLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIAXEKGV

250 260 270 280 290 300

orf114.pep GVX

||

orf114a GVKNAGTLEAAKQLIVTSSGRIENSGRIATTADGTEASPTYLXIETTEKGAXGTFISNGG

310 320 330 340 350 360

全长ORF114a的核苷酸序列<SEQ ID 61>是：

1 ATGAATAAAG GTTTACATCG CATTATCTTT AGTAAAAAGC ACAGCACCAT

51 GGTTGCAGTA GCCGAAACTG CCAACAGCCA GGGCAAAGGT AAACAGGCAG

101 GCAGTTCGGT TTCTGTTTCA CTGAAAACTT CAGGCGACCT TTGCGGCAAA

151 CTCAAAACCA CCCTTAAAAC CTTGGTCTGC TCTTTGGTTT CCCTGAGTAT

201 GGNATTNCNN NNCNNTNCCC AAATTACCAC CGACAAATCA GCACCTAAAA

251 ACCANCAGGT CGTTATCCTT AAAACCAACA CTGGTGCCCC CTTGGTGAAT

301 ATCCAAACTC CGAATGGACG CGGATTGAGC CACAACCGCT ATACGCAGTT

351 TGATGTTGAC AACAAAGGGG CAGTGTTAAA CAACGACCGT AACAATAATC

401 CGTTTCTGGT CAAAGGCAGT GCGCAATTGA TTTTGAACGA GGTACGCGGT

451 ACGGCTAGCA AACTCAACGG CATCGTTACC GTAGGCGGTC AAAAGGCCGA

501 CGTGATTATT GCCAACCCCA ACGGCATTAC CGTTAATGGC GGCGGCTTTA

551 AAAATGTCGG TCGGGGCATC TTAACTATCG GTGCGCCCCA AATCGGCAAA

601 GACGGTGCAC TGACAGGATT TGATGTGCGT CAAGGCACAT TGACCGTAGG

651 AGCAGCAGGT TGGAATGATA AAGGCGGAGC CGACTACACC GGGGTACTTG

701 CTCGTGCAGT TGCTTTGCAG GGGAAATTAC AGGGTAAAAA CCTGGCGGTT

751 TCTACCGGTC CTCAGAAAGT AGATTACGCC AGCGGCGAAA TCAGTGCAGG

801 TACGGCAGCG GGTACGAAAC CGACTATTGC CCTTGATACT GCCGCACTGG

851 GCGGTATGTA CGCCGACAGC ATCACACTGA TTGCCANTGA AAAAGGCGTA

901 GGCGTCAAAA ATGCCGGCAC ACTCGAAGCG GCCAAGCAAT TGATTGTGAC

951 TTCGTCAGGC CGCATTGAAA ACAGCGGCCG CATCGCCACC ACTGCCGACG

1001 GCACCGAAGC TTCACCGACT TATCTNNCNA TCGAAACCAC CGAAAAAGGA

1051 GCNNCAGGCA CATTTATCTC CAATGGTGGT CGGATCGAGA GCAAAGGCTT

1101 ATTGGTTATT GAGACGGGAG AAGATATCAN CTTGCGTAAC GGAGCCGTGG

1151 TGCAGAATAA CGGCAGTCGC CCAGCTACCA CGGTATTAAA TGCTGGTCAT

1201 AATTTGGTGA TTGAGAGTAA AACTAATGTG AACAATGCCA AAGGCTCGNC

1251 TAATCTGTCG GCCGGCGGTC GTACTACGAT CAATGATGCT ACTATTCAAG

1301 CGGGCAGTTC CGTGTACAGC TCCACCAAAG GCGATACTGA NTTGGGTGAA

1351 AATACCCGTA TTATTGCTGA AAACGTAACC GTATTATCTA ACGGTAGTAT

1401 TGGCAGTGCT GCTGTAATTG AGGCTAAAGA CACTGCACAC ATTGAATCGG

1451 GCAAACCGCT TTCTTTAGAA ACCTCGACCG TTGCCTCCAA CATCCGTTTG

1501 AACAACGGTA ACATTAAAGG CGGAAAGCAG CTTGCTTTAC TGGCAGACGA

1551 TAACATTACT GCCAAAACTA CCAATCTGAA TACTCCCGGC AATCTGTATG

1601 TTCATACAGG TAAAGATCTG AATTTGAATG TTGATAAAGA TTTGTCTGCC

1651 GCCAGCATCC ATTTGAAATC GGATAACGCT GCCCATATTA CCGGCACCAG

1701 TAAAACCCTC ACTGCCTCAA AAGACATGGG TGTGGAGGCA GGCTTGCTGA

1751 ATGTTACCAA TACCAATCTG CGTACCAACT CGGGTAATCT GCACATTCAG

1801 GCAGCCAAAG GCAATATTCA GCTTCGCAAT ACCAAGCTGA ACGCAGCCAA

1851 GGCTCTCGAA ACCACCGCAT TGCAGGGCAA TATCGTTTCA GACGGCCTTC

1901 ATGCTGTTTC TGCAGACGGT CATGTATCCT TATTGGCCAA CGGTAATGCC

1951 GACTTTACCG GTCACAATAC CCTGACAGCC AAGGCCGATG TCNATGCAGG

2001 ATCGGTTGGT AAAGGCCGTC TGAAAGCAGA CAATACCAAT ATCACTTCAT

2051 CTTCAGGAGA TATTACGTTG GTTGCCGNNN NCGGTATTCA GCTTGGTGAC

2101 GGAAAACAAC GCAATTCAAT CAACGGAAAA CACATCAGCA TCAAAAACAA

2151 CGGTGGTAAT GCCGACTTAA AAAACCTTAA CGTCCATGCC AAAAGCGGGG

2201 CATTGAACAT TCATTCCGAC CGGGCATTGA GCATAGAAAA TACNAAGCTG

2251 GAGTCTACCC ATAATACGCA TCTTAATGCA CAACACGAGC GGGTAACGCT

2301 CAACCAAGTA GATGCCTACG CACACCGTCA TCTAAGCATT ANCGGCAGCC

2351 AGATTTGGCA AAACGACAAA CTGCCTTCTG CCAACAAGCT GGTGGCTAAC

2401 GGTGTATTGG CANTCAATGC GCGCTATTCC CAAATTGCCG ACAACACCAC

2451 GCTGAGAGCG GGTGCAATCA ACCTTACTGC CGGTACCGCC CTAGTCAAGC

2501 GCGGCAACAT CAATTGGAGT ACCGTTTCGA CCAAGACTTT GGAAGATAAT

2551 GCCGAATTAA AACCATTGGC CGGACGGCTG AATATTGAAG CAGGTAGCGG

2601 CACATTAACC ATCGAACCTG CCAACCGCAT CAGTGCGCAT ACCGACCTGA

2651 GCATCAAAAC AGGCGGAAAA TTGCTGTTGT CTGCAAAAGG AGGAAATGCA

2701 GGTGCGCNTA GTGCTCAAGT TTCCTCATTG GAAGCAAAAG GCAATATCCG

2751 TCTGGTTACA GGAGNAACAG ATTTAAGAGG TTCTAAAATT ACAGCCGGTA

2801 AAAACTTGGT TGTCGCCACC ACCAAAGGCA AGTTGAATAT CGAAGCCGTA

2851 AACAACTCAT TCAGCAATTA TTTTCNTACA CAAAAAGNGN NNGNNCTCAA

2901 CCAAAAATCC AAAGAATTGG AACAGCAGAT TGCGCAGTTG AAAAAAAGCT

2951 CGCNTAAAAG CAAGCTGATT CCAACCCTGC AAGAAGAACG CGACCGTCTC

3001 GCTTTCTATA TTCAAGCCAT CAACAAGGAA GTTAAAGGTA AAAAACCCAA

3051 AGGCAAAGAA TACCTGCAAG CCAAGCTTTC TGCACAAAAT ATTGACTTGA

3101 TTTCCGCACA AGGCATCGAA ATCAGCGGTT CCGATATTAC CGCTTCCAAA

3151 AAACTGAACC TTCACGCCGC AGGCGTATTG CCAAAGGCAG CAGATTCAGA

3201 GGCGGCTGCT ATTCTGATTG ACGGCATAAC CGACCAATAT GAAATTGGCA

3251 AGCCCACCTA CAAGAGTCAC TACGACAAAG CTGCTCTGAA CAAGCCTTCA

3301 CGTTTGACCG GACGTACGGG GGTAAGTATT CATGCAGCTG CGGCACTCGA

3351 TGATGCACGT ATTATTATCG GTGCATCCGAAATCAAAGCT CCCTCAGGCA

3401 GCATAGACAT CAAAGCCCAT AGTGATATTG TACTGGAGGC TGGACAAAAC

3451 GATGCCTATA CCTTCTTANA AACCAAAGGT AAAAGCGGCA NAATNATCAG

3501 AAAAACNAAG TTTACCAGCA CCNGCGANCA CCTGATTATG CCAGCCCCNG

3551 TCGAGCTGAC CGCCAACGGT ATCACGCTTC AGGCAGGCGG CAACATCGAA

3601 GCTAATACCA CCCGCTTCAA TGCCCCTGCA GGTAAAGTTA CCCTGGTTGC

3651 GGGTGAANAG NTGCAACTGC TGGCAGAAGA AGGCATCCAC AAGCACGAGT

3701 TGGATGTCCA AAAAAGCCGC CGCTTTATCG GCATCAAGGT AGGTNAGAGC

3751 AATTACAGTA AAAACGAACT GAACGAAACC AAATTGCCTG TCCGCGTCGT

3801 CGCCCAAANT GCAGCCACCC GTTCAGGCTG GGATACCGTG CTCGAAGGTA

3851 CCGAATTCAA AACCACGCTG GCCGGTGCCG ACATTCAGGC AGGTGTANGC

3901 GAAAAAGCCC GTGTCGATGC GAAAATTATC CTCAAAGCCA TTGTGAACCG

3951 TATCCAGTCG GAAGAAAAAT TAGAAACCAA CTCAACCGTA TGGCAGAAAC

4001 AGGCCGGACG CGGCAGCACT ATCGAAACGC TAAAACTGCC CAGCTTCGAA

4051 AGCCCTACTC CGCCCAAATT GTCCGCACCC GGCGGNTATA TCGTCGACAT

4101 TCCGAAAGGC AATCTGAAAA CCGAAATCGA AAAGCTGTCC AAACAGCCCG

4151 AGTATGCCTA TCTGAAACAG CTCCAAGTAG CGAAAAACAT CAACTGGAAT

4201 CAGGTGCAGC TTGCTTACGA CAGATGGGAC TACAAACAGG AGGGCTTAAC

4251 CGAAGCAGGT GCGGCGATTA TCGCACTGGC CGTTACCGTG GTCACCTCAG

4301 GCGCAGGAAC CGGAGCCGTA TTGGGATTAA ACGGTGCGNC CGCCGCCGCA

4351 ACCGATGCAG CATTCGCCTC TTTGGCCAGC CAGGCTTCCG TATCGTTCAT

4401 CAACAACAAA GGCGATGTCG GCAAAACCCT GAAAGAGCTG GGCAGAAGCA

4451 GCACGGTGAA AAATCTGGTG GTTGCCGCCG CTACCGCAGG CGTAGCCGAC

4501 AAAATCGGCG CTTCGGCACT GANCAATGTC AGCGATAAGC AGTGGATCAA

4551 CAACCTGACC GTCAACCTAG CCAATGNCGG GCAGTGCCGC ACTGAttaa

它编码的蛋白质具有氨基酸序列<SEQ ID 62>：

1 MNKGLHRIIF SKKHSTMVAV AETANSQGKG KQAGSSVSVS LKTSGDLCGK

51 LKTTLKTLVC SLVSLSMXXX XXXQITTDKS APKNXQVVIL KTNTGAPLVN

101 IQTPNGRGLS HNRYTQFDVD NKGAVLNNDR NNNPFLVKGS AQLILNEVRG

151 TASKLNGIVT VGGQKADVII ANPNGITVNG GGFKNVGRGI LTIGAPQIGK

201 DGALTGFDVR QGTLTVGAAG WNDKGGADYT GVLARAVALQ GKLQGKNLAV

251 STGPQKVDYA SGEISAGTAA GTKPTIALDT AALGGMYADS ITLIAXEKGV

301 GVKNAGTLEA AKQLIVTSSG RIENSGRIAT TADGTEASPT YLXIETTEKG

351 AXGTFISNGG RIESKGLLVI ETGEDIXLRN GAVVQNNGSR PATTVLNAGH

401 NLVIESKTNV NNAKGSXNLS AGGRTTINDA TIQAGSSVYS STKGDTXLGE

451 NTRIIAENVT VLSNGSIGSA AVIEAKDTAH IESGKPLSLE TSTVASNIRL

501 NNGNIKGGKQ LALLADDNIT AKTTNLNTPG NLYVHTGKDL NLNVDKDLSA

551 ASIHLKSDNA AHITGTSKTL TASKDMGVEA GLLNVTNTNL RTNSGNLHIQ

601 AAKGNIQLRN TKLNAAKALE TTALQGNIVS DGLHAVSADG HVSLLANGNA

651 DFTGHNTLTA KADVXAGSVG KGRLKADNTN ITSSSGDITL VAXXGIQLGD

701 GKQRNSINGK HISIKNNGGN ADLKNLNVHA KSGALNIHSD RALSIENTKL

751 ESTHNTHLNA QHERVTLNQV DAYAHRHLSI XGSQIWQNDK LPSANKLVAN

801 GVLAXNARYS QIADNTTLRA GAINLTAGTA LVKRGNINWS TVSTKTLEDN

851 AELKPLAGRL NIEAGSGTLT IEPANRISAH TDLSIKTGGK LLLSAKGGNA

901 GAXSAQVSSL EAKGNIRLVT GXTDLRGSKI TAGKNLVVAT TKGKLNIEAV

951 NNSFSNYFXT QKXXXLNQKS KELEQQIAQL KKSSXKSKLI PTLQEERDRL

1001 AFYIQAINKE VKGKKPKGKE YLQAKLSAQN IDLISAQGIE ISGSDITASK

1051 KLNLHAAGVL PKAADSEAAA ILIDGITDQY EIGKPTYKSH YDKAALNKPS

1101 RLTGRTGVSI HAAAALDDAR IIIGASEIKA PSGSIDIKAH SDIVLEAGQN

1151 DAYTFLXTKG KSGXXIRKTK FTSTXXHLIM PAPVELTANG ITLQAGGNIE

1201 ANTTRFNAPA GKVTLVAGEX XQLLAEEGIH KHELDVQKSR RFIGIKVGXS

1251 NYSKNELNET KLPVRVVAQX AATRSGWDTV LEGTEFKTTL AGADIQAGVX

1301 EKARVDAKII LKGIVNRIQS EEKLETNSTV WQKQAGRGST IETLKLPSFE

1351 SPTPPKLSAP GGYIVDIPKG NLKTEIEKLS KQP EYAYLKQ LQVAKNINWN

1401 QVQLAYDRWD YKQEGLTEAG AAIIALAVTV VTSGAGTGAV LGLNGAXAAA

1451 TDAAFASLAS QASVSFINNK GDVGKTLKEL GRSSTVKNLV VAAATAGVAD

1501 KIGASALXNV SDKQWINNLT VNLANXGQCR TD*

ORF114-1和ORF114a显示在1564个重叠的氨基酸内有89.8％的相同性。

orf114a.pep MNKGLHRIIFSKKHSTMVAVAETANSQGKGKQAGSSVSVSLKTSGDLCGKLKTTLKTLVC

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf114-1 MNKGLHRIIFSKKHSTMVAVAETANSQGKGKQAGSSVSVSLKTSGDLCGKLKTTLKTLVC

orf114a.pep SLVSLSMXXXXXXQITTDKSAPKNXQVVILKTNTGAPLVNIQTPNGRGLSHNRYTQFDVD

||||||| |||||||||| |||||||||||||||||||||||||||||||||||

orf114-1 SLVSLSMVLPAHAQITTDKSAPKNQQVVILKTNTGAPLVNIQTPNGRGLSHNRYTQFDVD

orf114a.pep NKGAVLNNDRNNNPFLVKGSAQLILNEVRGTASKLNGIVTVGGQKADVIIANPNGITVNG

|||||||||||||||:||||||||||||||||||||||||||||||||||||||||||||

orf114-1 NKGAVLNNDRNNNPFVVKGSAQLILNEVRGTASKLNGIVTVGGQKADVIIANPNGITVNG

orf114a.pep GGFKNVGRGILTIGAPQIGKDGALTGFDVRQGTLTVGAAGWNDKGGADYTGVLARAVALQ

|||||||||||| |||||||||||||||||||||||||||||||||||||||||||||||

orf114-1 GGFKNVGRGILTTGAPQIGKDGALTGFDVRQGTLTVGAAGWNDKGGADYTGVLARAVALQ

orf114a.pep GKLQGKNLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIAXEKGV

||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||

orf114-1 GKLQGKNLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIANEKGV

orf114a.pep GVKNAGTLEAAKQLIVTSSGRIENSGRIATTADGTEASPTYLXIETTEKGAXGTFISNGG

|||||||||||||||||||||||||||||||||||||||||| |||||||| ||||||||

orf114-1 GVKNAGTLEAAKQLIVTSSGRIENSGRIATTADGTEASPTYLSIETTEKGAAGTFISNGG

orf114a.pep RIESKGLLVIETGEDIXLRNGAVVQNNGSRPATTVLNAGHNLVIESKTNVNNAKGSXNLS

|||||||||||||||| |||||||||||||||||||||||||||||||||||||| :||

orf114-1 RIESKGLLVIETGEDISLRNGAVVQNNGSRPATTVLNAGHNLVIESKTNVNNAKGPATLS

orf114a.pep AGGRTTINDATIQAGSSVYSSTKGDTXLGENTRIIAENVTVLSNGSIGSAAVIEAKDTAH

| |||:|::|:||:|::||||:||:: ||:|||| : :|||||||:|:|:|||:||||||

orf114-1 ADGRTVIKEASIQTGTTVYSSSKGNAELGNNTRITGADVTVLSNGTISSSAVIDAKDTAH

orf114a.pep IESGKPLSLETSTVASNIRLNNGNIKGGKQLALLADDNITAKTTNLNTPGNLYVHTGKDL

||:|||||||:|||:|:||||:|:||||||||||||||||||||||||||||||||||||

orf114-1 IEAGKPLSLEASTVTSDIRLNGGSIKGGKQLALLADDNITAKTTNLNTPGNLYVHTGKDL

orf114a.pep NLNVDKDLSAASIHLKSDNAAHITGTSKTLTASKDMGVEAGLLNVTNTNLRTNSGNLHIQ

||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||

orf114-1 NLNVDKDLSAASIHLKSDNAAHITGTSKTLTASKDMGVEAGSLNVTNTNLRTNSGNLHIQ

orf114a.pep AAKGNIQLRNTKLNAAKALETTALQGNIVSDGLHAVSADGHVSLLANGNADFTGHNTLTA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf114-1 AAKGNIQLRNTKLNAAKALETTALQGNIVSDGLHAVSADGHVSLLANGNADFTGHNTLTA

orf114a.pep KADVXAGSVGKGRLKADNTNITSSSGDITLVAXXGIQLGDGKQRNSINGKHISIKNNGGN

|||| ||||||||||||||||||||||||||| ||||||||||||||||||||||||||

orf114-1 KADVNAGSVGKGRLKADNTNITSSSGDITLVAGNGIQLGDGKQRNSINGKHISIKNNGGN

orf114a.pep ADLKNLNVHAKSGALNIHSDRALSIENTKLESTHNTHLNAQHERVTLNQVDAYAHRHLSI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf114-1 ADLKNLNVHAKSGALNIHSDRALSIENTKLESTHNTHLNAQHERVTLNQVDAYAHRHLSI

orf114a.pep XGSQIWQNDKLPSANKLVANGVLAXNARYSQIADNTTLRAGAINLTAGTALVKRGNINWS

:||||||||||||||||||||||| |||||||||||||||||||||||||||||||||||

orf114-1 TGSQIWQNDKLPSANKLVANGVLALNARYSQIADNTTLRAGAINLTAGTALVKRGNINWS

orf114a.pep TVSTKTLEDNAELKPLAGRLNIEAGSGTLTIEPANRISAHTDLSIKTGGKLLLSAKGGNA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf114-1 TVSTKTLEDNAELKPLAGRLNIEAGSGTLTIEPANRISAHTDLSIKTGGKLLLSAKGGNA

orf114a.pep GAXSAQVSSLEAKGNIRLVTGXTDLRGSKITAGKNLVVATTKGKLNIEAVNNSFSNYFXT

|| |||||||||||||||||| |||||||||||||||||||||||||||||||||||| |

orf114-1 GAPSAQVSSLEAKGNIRLVTGETDLRGSKITAGKNLVVATTKGKLNIEAVNNSFSNYFPT

orf114a.pep QKXXXLNQKSKELEQQIAQLKKSSXKSKLIPTLQEERDRLAFYIQAINKEVKGKKPKGKE

|| ||||||||||||||||||| |||||||||||||||||||||||||||||||||||

orf114-1 QKAAELNQKSKELEQQIAQLKKSSPKSKLIPTLQEERDRLAFYIQAINKEVKGKKPKGKE

orf114a.pep YLQAKLSAQNIDLISAQGIEISGSDITASKKLNLHAAGVLPKAADSEAAAILIDGITDQY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf114-1 YLQAKLSAQNIDLISAQGIEISGSDITASKKLNLHAAGVLPKAADSEAAAILIDGITDQY

orf114a.pep EIGKPTYKSHYDKAALNKPSRLTGRTGVSIHAAAALDDARIIIGASEIKAPSGSIDIKAH

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf114-1 EIGKPTYKSHYDKAALNKPSRLTGRTGVSIHAAAALDDARIIIGASEIKAPSGSIDIKAH

orf114a.pep SDIVLEAGQNDAYTFLXTKGKSGXXIRKTKFTSTXXHLIMPAPVELTANGITLQAGGNIE

|||||||||||||||| |||||| ||||||||| ||||||||||||||||||||||||

orf114-1 SDIVLEAGQNDAYTFLKTKGKSGKIIRKTKFTSTRDHLIMPAPVELTANGITLQAGGNIE

orf114a.pep ANTTRFNAPAGKVTLVAGEXXQLLAEEGIHKHELDVQKSRRFIGIKVGXSNYSKNELNET

||||||||||||||||||| ||||||||||||||||||||||||||| |||||||||||

orf114-1 ANTTRFNAPAGKVTLVAGEELQLLAEEGIHKHELDVQKSRRFIGIKVGKSNYSKNELNET

orf114a.pep KLPVRVVAQXAATRSGWDTVLEGTEFKTTLAGADIQAGVXEKARVDAKIILKGIVNRIQS

|||||||||:||||||||||||||||||||||||||||| ||||:|||||||||||||||

orf114-1 KLPVRVVAQTAATRSGWDTVLEGTEFKTTLAGADIQAGVGEKARADAKIILKGIVNRIQS

orf114a.pep EEKLETNSTVWQKQAGRGSTIETLKLPSFESPTPPKLSAPGGYIVDIPKGNLKTEIEKLS

|||||||||||||||||||||||||||||||||||||:|||||||||||||||||||||:

orf114-1 EEKLETNSTVWQKQAGRGSTIETLKLPSFESPTPPKLTAPGGYIVDIPKGNLKTEIEKLA

orf114a.pep KQPEYAYLKQLQVAKNINWNQVQLAYDRWDYKQEGLTEAGAAIIALAVTVVTSGAGTGAV

||||||||||||||||:||||||||||:|||||||||:|||||::: ||::| | |: |:

orf114-1 KQPEYAYLKQLQVAKNVNWNQVQLAYDKWDYKQEGLTRAGAAIVTIIVTALTYGYGATAA

orf114a.pep LGLNGA--------------XAAATD---------AAFASLASQASVSFINNKGDVGKTL 1477

|: :: :|||| ||:||| |||:||:|||||||||:|

orf114-1 GGVAASGSSTAAAAGTAATTTAAATTVSTATAMQTAALASLYSQAAVSIINNKGDVGKAL 1500

orf114a.pep KELGRSSTVKNLVVAAATAGVADKIGA----------SALXNVSDKQWINNL----TVNL 1523

|:|| |:|||::|::| |||: :::|| : | : : :| | || ::||

orf114-1 KDLGTSDTVKQIVTSALTAGALNQMGADIAQLNSKVRTELFSSTGNQTIANLGGRLATNL 1560

orf114a.pep ANXGQCRTDX

:| |

orf114-1 SNAGISAGINTAVN...

与脑膜炎奈瑟氏球菌的pspA推定分泌蛋白(登录号AF030941)的同源性

ORF114和pspA蛋白显示在302个重叠氨基酸内有36％的氨基酸相同性：

0rf114：1 AVAETANSQGKGKQAGSSVSVSL----KTSGDXXXXXXXXXXXXXXXXXXXXXXXPAHAQ 56

AVAE + GK Q + SV + S PA A

pspA： 19 AVAENVHRDGKSMQDSEAASVRVTGAASVSSARAAFGFRMAAFSVMLALGVAAFSPAPAS 78

0rf114：57 -ITTDKSAPKNQQVVILKTNTGAPLVNIQTPNGRGLSHNRXYAFDVDNKGAVLNNDRNN- 114

I DKSAPKNQQ VIL+T G P VNIQTP+ +G+S NR FDVD KG +LNN R+N

pspA： 79 GIIADKSAPKNQQAVILQTANGLPQVNIQTPSSQGVSVNRFKQFDVDEKGVILNNSRSNT 138

0rf114：115 ----------NPFVVKGSAQLILNEV-RGTASKLNGIVTVGGQKADVIIANPNGITVNGG 163

NP + +G A++I+N++ S LNG + VGG++A+V++ANP+GI VNGG

pspA： 139 QTQLGGWIQGNPHLARGEARVIVNQIDSSNPSLLNGYIEVGGKRAEVVVANPSGIRVNGG 198

0rf114：164 GFKNVGRGILTTGAPQIGKDGALTGFDVVKAHWTVXAAGWNDKGGAXYTGVLARAVALQG 223

G N LT+G P + +G LTGFDV + G D A YT +L+RA +

pspA： 199 GLINAASVTLTSGVPVL-NNGNLTGFDVSSGKVVIGGKGL-DTSDADYTRILSRAAEINA 256

0rf114：224 KXXGKXLAVSTGPQKVDYASGEISAGTAAGTK----PTIALDTAALGGMYADSITLIANE 279

GK + V +G K+D+ +A + PT+A+DTA LGGMYAD ITLI+ +

pspA： 257 GVWGKDVKVVSGKNKLDFDGSLAKTASAPSSSDSVTPTVAIDTATLGGMYADKITLISTD 316

0rf114：280 KG 281

G

DsDA： 317 NG 318

ORF114a也与pspAs同源：

gi|2623258(AF03D941)推定分泌蛋白[脑膜炎奈瑟氏球菌]长度＝2273

评分＝261bits(659)，预计＝3e-68

相同性＝203/663(30％)，阳性＝314/663(46％)，空隙＝76/663(11％)

询问：1 MNKGLHRIIFSKKHSTMVAVAETANSQGKGKQAGSSVSVSLK-----TSGDXXXXXXXXX 55

MNK +++IF+KK S M+AVAE + GK Q + SV + +S

目标：1 MNKRCYKVIFNKKRSCMMAVAENVHRDGKSMQDSEAASVRVTGAASVSSARAAFGFRMAA 60

询问：56 XXXXXXXXXXXXXXXXXXQITTDKSAPKNXQVVILKTNTGAPLVNIQTPNGRGLSHNRYT 115

I DKSAPKN Q VIL+T G P VNIQTP+ +G+S NR+

目标：61 FSVMLALGVAAFSPAPASGIIADKSAPKNQQAVILQTANGLPQVNIQTPSSQGVSVNRFK 120

询问：116 QFDVDNKGAVLNNDRNN-----------NPFLVKGSAQLILNEV-RGTASKLNGIVTVGG 163

QFDVD KG +LNN R+N NP L +G A++I+N++ S LNG + VGG

目标：121 QFDVDEKGVILNNSRSNTQTQLGGWIQGNPHLARGEARVIVNQIDSSNPSLLNGYIEVGG 180

询问：164 QKADVIIANPNGITVNGGGFKNVGRGILTIGAPQIGKDGALTGFDVRQGTLTVGAAGWND 223

++A+V++ANP+GI VNGGG N LT G P + +G LTGFDV G + +G G D

目标：181 KRAEVVVANPSGIRVNGGGLINAASVTLTSGVPVL-NNGNLTGFDVSSGKVVIGGKGL-D 238

询问：224 KGGADYTGVLARAVALQGKLQGKNLAVSTGPQKVDYASGEISAGTAAGTK----PTIALD 279

ADYT +L+RA + + GK++ V +G K+D+ +A + PT+A+D

目标：239 TSDADYTRILSRAAEINAGVWGKDVKVVSGKNKLDFDGSLAKTASAPSSSDSVTPTVAID 298

询问：280 TAALGGMYADSITLIAXEKGVGVKNAGTLEAAK-QLIVTSSGRIENSGRIATTADGTEAS 338

TA LGGMYAD ITLI+ + G ++N G + AA + +++ G++ NSG I +A+

目标：299 TATLGGMYADKITLISTDNGAVIRNKGRIFAATGGVTLSADGKLSNSGSI-------DAA 351

询问：339 PTYLXIETTEKGAXGTFISNGGRIESKGLLVIETGEDIXLRNGAVVQNNGSRPATTVLNA 398

+ +T + + G I S V++ + I + G + GS + +

目标：352 EITISAQTVD--------NRQGFIRSGKGSVLKVSDGINNQAGLI----GSAGLLDIRDT 399

询问：399 GHNLVIESKTNVNNAKGS----XNLSAGGRTTINDATIQAGSSVYSSTKGDTXLGENTRI 454

G +S ++NN G+ ++S ++ ND + A V S + D G+

目标：400 G-----KSSLHINNTDGTIIAGKDVSLQAKSLDNDGILTAARDV-SVSLHDDFAGKRDIE 453

询问：455 IAENVTVLSNGSIGSAAVIEAKDTAHIESGKPLSLETSTVASNIRLNNGNIKGGKQLALL 514

+T + G + + +I+A DT + + + + + + S R G L+

目标：454 AGRTLTFSTQGRLKNTRIIQAGDTVSLTAAQIDNTVSGKIQSGNRTGLNGKNGITNRGLI 513

询问：515 ADDNIT-----AKTTNLNTPGNLYVHTGKDLNLNVDKDLSAASIHLKSDNAAHITGTSKT 569

+ IT AK+ N T G +Y G + + D L+ AA

目标：514 NSNGITLLQTEAKSDNAGT-GRIY---GSRVAVEADTLLNREETVNGETKAA-------V 562

询问：570 LTASKDMGVEAGXXXXXXXXXXXXSGNLHIQAA---KGNIQLRNTKL-NAAKALETTALQ 625

+ A + + + A SG+LHI +A +Q NT L N + A+E++

目标：563 IAARERLDIGAREIENREAALLSSSGDLHIGSALNGSRQVQGANTSLHNRSAAIESS---619

询问：626 GNI 628

GNI

目标：620 GNI 622

评分＝37.5bits(85)，预计＝0.53

相同性＝87/432(20％)，阳性＝159/432(36％)，空隙＝62/432(14％)

询问：239 LQGKLQGKNLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIAXEK 298

LQG LQGKN+ + G + +G I A A K A + + S T +

目标：1023 LQGDLQGKNIFAAAGSDITN--TGSIGAENALLLK--------ASNNIESRSETRSNQNE 1072

询问：299 GVGVKNAGTLEAAKQLIVTSSGRI--ENSGRIATTADGTEASPTYLXIETTEKGAXG-TF 355

V+N G + A L +G + + I TA E T + G T

目标：1073 QGSVRNIGRV-AGIYLTGRQNGSVLLDAGNNIVLTAS-----------ELTNQSEDGQTV 1120

询问：356 ISNGGRIESKGLLVIETGEDIXLRNGAVVQNNGSRPATTVLNAGHNLVIESK-------T 408

++ GG I S + I + V++ + +T+ G NL + +K

目标：1121 LNAGGDIRSDTTGISRNQNTIFDSDNYVIRKEQNEVGSTIRTRG-NLSLNAKGDIRIRAA 1179

询问：409 NVNNAKGSXNLSAGGRTTINDATIQAGSS--------VYSSTKGDTXLGENTRIIAENVT 460

V + +G L+AG D ++AG + Y+ G + TR +

目标：1180 EVGSEQGRLKLAAG-----RDIKVEAGKAHTETEDALKYTGRSGGGIKQKMTRHLKNQNG 1234

询问：461 VLSNGSIGSAAVIEAKDTAHIESGKPLSLETSTVASNIRLNNGNIKGGKQLALLADDNIT 520

+G++ +I +G + + T+ S NN +K + + A+ N

目标：1235 QAVSGTLDGKEIILVSGRDITVTGSNIIADNHTILS--AKNNIVLKAAETRSRSAEMNKK 1292

询问：521 AKTTNLNTPG-NLYVHTGKDLNLNVDKDLSAASIHLKSDN-------AAHITGTSKTLTA 572

K+ + + G + KD N + +S + S N H T T T+++

目标：1293 EKSGLMGSGGIGFTAGSKKDTQTNRSETVSHTESVVGSLNGNTLISAGKHYTQTGSTISS 1352

询问：573 SK-DMGVEAGXXXXXXXXXXXXSGNLHIQAAKG-----NIQLRNTKLNAAKALETTALQG 626

+ D+G+ +G + + KG ++ + NT + A A++ G

目标：1353 PQGDVGISSGKISIDAAQNRYSQESKQVYEQKGVTVAISVPVVNTVMGAVDAVKAVQTVG 1412

询问：627 NIVSDGLHAVSA 638

+ ++A++A

目标：1413 KSKNSRVNAMAA 1424

如上所述，将ORF114-1的氨基酸1-1423克隆到pGex载体中并在大肠杆菌中表达。用SDS-PAGE可以看到GST-融合物表达，图5显示了ORF114-1的亲水性曲线、抗原性指数和AMPHI区域。

根据这些结果，包括与脑膜炎奈瑟氏球菌的推定分泌蛋白同源以及存在一个跨膜结构域，预计脑膜炎奈瑟氏球菌的该蛋白及其表位可用作疫苗或诊断用的抗原。

实施例14

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 63>

1 ..CGCTTCATTC ATGATGAAGC AGTCGGCAGC AACATCGGCG GCGGCAAAAT

51 GATTGTTGCA GCCGGGCAGG ATATCAATGT ACGCGGCAnA AGCCTTATTT

101 CTGATAAGGG CATTGTTTTA AAAGCAGGAC ACGACATCGA TATTTCTACT

151 GCCCATAATC GCTATACCGG CAATGAATAC CACGAGAGCA wAAAwTCAGG

201 CGTCATGGGT ACTGGCGGAT TGGGCTTTAC TATCGGTAAC CGGAAAACTA

251 CCGATGACAC TGATCGTACC AATATTGTsC ATACAGGCAG CATTATAGGC

301 AGCCTGAaTG GAGACACCGT TACAGTTGCA GGAAACCGCT ACCGACAAAC

351 CGGCAGTACC GTCTCCAGCC CCGAGGGGCG CAATACCGTC ACAGCCAAAw

401 GCATAGATGT AGAGTTCGCA AACAACCGGT ATGCCACTGA CTACGcCCAT

451 ACCCA gGGAA CAAAAAGGCC TTACCGTCGC CCTCAATGTC CCGGTTGTCC

501 AAGCTGCACA AAACTTCATA CAAGCAGCCC AAAATGTGGG CAAAAGTAAA

551 AATAAACGCG TTAATGCCAT GGCTGCAGCC AATGCTGCAT GGCAGAGTTA

601 TCAAGCAACC CAACAAATGC AACAATTTGC TCCAAGCAGC AGTGCGGGAC

651 AAGGTCAAAA CTACAATCAA AGCCCCAGTA TCAGTGTGTC CATTAC.TAC

701 GGCGAACAGA AAAGTCGTAA CGAGCAAAAA AGACATTACA CCGAAgCGGC

751 AgCAAGTCAA ATTATCGGCA AAGGGCAAAC CACACTTGCG GCAACAGGAA

801 GTGGGGAGCA GTCCAATATC AATATTACAG GTTCCGATGT CATCGGCCAT

851 GCAGGTACTC C.CTCATTGC CGACAACCAT ATCAGACTCC AATCTGCCAA

901 ACAGGACGGC AGCGAGCAAA GCAAAAACAA AAGCAGTGGT TGGAATGCAG

951 GCGTACGTnn CAAAATAGGC AACGGCATCA GGTTTGGAAT TACCGCCGGA

1001 GGAAATATCG GTAAAGGTAA AGAGCAAGGG GGAAGTACTA CCCACCGCCA

1051 CACCCATGTC GGCAGCACAA CCGGCAAAAC TACCATCCGA AGCGGCGGG G

1101 GATACCACCC TCAAAGGTGT GCAGCTCATC GGCAAAGGCA TACAGGCAGA

1151 TACGCGCAAC CTGCATATAG AAAGTGTTCA AGATACTGAA ACCTATCAGA

1201 GCAAACAGCA AAACGGCAAT GTCCAAGTT t ACTGTCGGTT ACGGATTCAG

1251 TGCAAGCGGC AGTTACCGCC AAAGCAAAGT CAAAGCAGAC CATGCCTCCG

1301 TAACCGGGCA AAgCGGTATT TATGCCGGAG AAGACGGCTA TCAAATyAAA

1351 GTyAGAGACA ACACAGACCT yAAGGGCGGT ATCATCACGT CTAGCCAAAG

1401 CGCAGAAGAT AAGGGCAAAA ACCTTTTTCA GACGGCCACC CTTACTGCCA

1451 GCGACATTCA AAACCACAGC CGCTACGAAG GCAGAAGCTT CGGCATAGGC

1501 GGCAGTTTCG ACCTGAACGG CGGCTGGGAC GGCACGGTTA CCGACAAACA

1551 AGGCAGGCCT ACCGACAGGA TAAGCCCGGC AGCCGGCTAC GGCAGCGACG

1601 GAGACAGCAA AAACAGCACC ACCCGCAGCG GCGTCAACAC CCACAACATA

1651 CACATCACCG ACGAAGCGGG ACAACTTGCC CGAACAGGCA GGACTGCAAA

1701 AGAAACCGAA GCGCGTATCT ACACCGGCAT CGACACCGAA ACTGCGGATC

1751 AACACTCAGG CCATCTGAAA AACAGCTTCG AC...

它对应于氨基酸序列<SEQ ID 64；ORF116>：

1 ..RFIHDEAVGS NIGGGKMIVA AGQDINVRGX SLISDKGIVL KAGHDIDIST

51 AHNRYTGNEY HESXXSGVMG TGGLGFTIGN RKTTDDTDRT NIVHTGSIIG

101 SLNGDTVTVA GNRYRQTGST VSSPEGRNTV TAKXIDVEFA NNRYATDYAH

151 TQEQKGLTVA LNVPVVQAAQ NFIQAAQNVG KSKNKRVNAM AAANAAWQSY

201 QATQQMQQFA PSSSAGQGQN YNQSPSISVS IXYGEQKSRN EQKRHYTEAA

251 ASQIIGKGQT TLAATGSGEQ SNINITGSDV IGHAGTXLIA DNHIRLQSAK

301 QDGSEQSKNK SSGWNAGVRX KIGNGIRFGI TAGGNIGKGK EQGGSTTHRH

351 THVGSTTGKT TIRSGGDTTL KGVQLIGKGI QADTRNLHIE SVQDTETYQS

401 KQQNGNVQVT VGYGFSASGS YRQSKVKADH ASVTGQSGIY AGEDGYQIKV

451 RDNTDLKGGI ITSSQSAEDK GKNLFQTATL TASDIQNHSR YEGRSFGIGG

501 SFDLNGGWDG TVTDKQGRPT DRISPAAGYG SDGDSKNSTT RSGVNTHNIH

551 ITDEAGQLAR TGRTAKETEA RIYTGIDTET ADQHSGHLKN SFD...

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟氏球菌pspA推定分泌蛋白(登录号AF030941)的同源性

ORF116和pspA蛋白显示在502个重叠的氨基酸内有38％的氨基酸相同性：

0rf116：6 EAVGSNIGGGKMIVAAGQDINVRGXSLISDKGIVLKAGHDIDISTAHNRYTGNEYHESXX 65

+AV + G ++I+ +G+DI V G ++I+D +L A ++I + A R E ++

PspA：1 235 QAVSGTLDGKEIILVSGRDITVTGSNIIADNHTILSAKNNIVLKAAETRSRSAEMNKKEK 1294

0rf1 16：66 XXXXXXXXXXXXXXNRKXXXXXXRTNIVHTGSIIGSLNGDTVTVAGNRYRQTGSTVSSPE 125

++K +HT S++GSLNG+T+ AG Y QTGST+SSP+

PspA：1295 SGLMGSGGIGFTAGSKKDTQTNRSETVSHTESVVGSLNGNTLISAGKHYTQTGSTISSPQ 1354

0rf116：126 GRNTVTAKXIDVEFANNRYATDYAHTQEQKGLTVALNVPXXXX---XXXXXXXXXXXGKS 182

G +++ I ++ A NRY+ + EQKG+TVA++VP GKS

PspA：1355 GDVGISSGKISIDAAQNRYSQESKQVYEQKGVTVAISVPVVNTVMGAVDAVKAVQTVGKS 1414

0rf116：183 KNKRYXXXXXXXXXWQSYQATQQMQQFA--PSSSAGQGQNYNQSPSISVSIXYGEQKSRN 240

KN RV + + + A P +AGQG ISVS+ YGEQK+ +

PspA：1415 KNSRVNAMAAANALNKGVDSGVALYNAARNPKKAAGQG--------ISVSVTYGEQKNTS 1466

0rf116：241 EQKRHYTEAAASQIIGKGQTTLAATGSGEQSNINITGSDVIGHAGTXLIADNHIRLQSAK 300

E+ T+ +I G G+ +L A+G+G+ S I ITGSDV G GT L A+N +++++A+

PspA：1467 ESRIKGTQVQEGKITGGGKVSLTASGAGKDSRITITGSDVYGGKGTRLKAENAVQIEAAR 1526

0rf116：301 QDGSEQSKNKSSGWNAGVRXKIGNGIRFGITAXXXXXXXXXXXXSTTHRHTHVGSTTGKT 360

Q E+S+NKS+G+NAGV I GI FG TA T +R++H+GS +T

PspA：1527 QTHQERSENKSAGFNAGVAIAINKGISFGFTAGANYGKGYGNGDETAYRNSHIGSKDSQT 1586

0rf116：361 TIRSGGDTTLKGVQLIGKGIQADTRNLHIESVQDTETYQSKQQNGNVQVTVGYGFSASGS 420

I SGGDT +KG QL GKG+ +LHIES+QDT ++ KQ+N + QVTVGYGFS GS

PspA：1587 AIESGGDTVIKGGQLKGKGVGVTAESLHIESLQDTAVFKGKQENVSAQVTVGYGFSVGGS 1646

0rf116：421 YRQSKVKADHASVTGQSGIYAGEDGYQIKVRDNTDLKGGIITSSQSAEDKGKNLFQTATL 480

Y +SK +D+ASV QSGI+AG DGY+I+V T L G + S DK KNL +T+ +

PspA：1647 YNRSKSSSDYASVNEQSGIFAGGDGYRIRVNGKTGLVGAAVVSD---ADKSKNLLKTSEI 1703

0rf116：481 TASDIQNHSRYEGRSFGIGGSF 502

DIQNH+ + G+ G F

PspA：1704 WHKDIQNHASAAASALGLSGGF 1725

根据与pspA的同源性，预计脑膜炎奈瑟氏球菌的该蛋白及其表位可用作疫苗或诊断用的抗原。

实施例15

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 65>

1 ..ACGACCGGCA GCCTCGGCGG CATACTGGCC GGCGGCGGCA CTTCCCTTGC

51 CGCACCGTAT TTGGACAAAG CGGCGGAAAA CCTCGGTCCG GCGGGCAAAG

101 CGGCGGTCAA CGCACTGGGC GGTGCGGCCA TCGGCTATGC AACTGGTGGT

151 AGTGGTGGTG CTGTGGTGGG TGCGAATGTA GATTGGAACA ATAGGCAGCT

201 GCATCCGAAA GAAATGGCGT TGGCCGACAA ATATGCCGAA GCCCTCAAGC

251 GCGAAGTTGA AAAACGCGAA GGCAGAAAAA TCAGCAGCCA AGAAGCGGCA

301 ATGAGAATCC GCAGGCAGAT ATGCGTTGGG TGGACAAAGG TTCCCAAGAC

351 GGCTATACCG ACCAAAGCGT CATATCCCTT ATCGGAATGA

它对应于氨基酸序列<SEQ ID 66；ORF 118>：

1 ..T TGSLGGILA GGGTSLAAPY LDKAAENLGP AGKAAVN ALG GAAIGYATGG

51 SGGAVVGANV DWNNRQLHPK EMALADKYAE ALKREVEKRE GRKISSQEAA

101 MRIRRQICVG WTKVPKTAIP TKASYPLSE*

该氨基酸序列的计算机分析揭示了两个推定的跨膜结构域。

根据该分析，预计脑膜炎奈瑟氏球菌的该蛋白及其表位可用作疫苗或诊断用的抗原。

实施例16

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 67>

1 ..CAATGCCGTC TGAAAAGCTC ACAATTTTAC AGACGGCATT TGTTATGCAA

51 GTACATATAC AGATTCCCTA TATACTGCCC AGrkGCGTGC GTgGCTGAAG

101 ACACCCCCTA CGCTTGCTAT TTGrAACAGC TCCAAGTCAC CAAAGACGTC

151 AACTGGAACC AGGTACwACT GGCGTACGAC AAATGGGACT ATAAACAGGA

201 AGGCTTAACC GGAGCCGGAG CAGCGATTAT TGCGCTGGCT GTTACCGTGG

251 TTACTGCGGG CGCGGGAgCC GGAGCCGCAC TGGGcTTAAA CGGCGCGGCc

301 GCAGCGGCAA CCGATGCCGC ATTCGCCTCG CTGGCCAGCC AGGcTTCCGT

351 ATCGCTCATC AaCAACAAAG GCAATATCGG TAaCACCCTG AAAGAGCTGG

401 GCAGAAGCAG CACGGTGAAA AATCTGATGG TTGCCGTCGc tACCGCAgGC

451 GTagCcgaCA AAATCGGTGC TTCGGCACTG AACAATGTCA GCGATAAGCA

501 GTGGATCAAC AACCTGACCG TCAACCTGGC CAATGCGGGC AGTGCCGCAC

551 TGATTAATAC CGCTGTCAAC GGCGGCAGCc tgAAAGACAA TCTGGAAGCG

601 AATATCCTTG CGGCTTTGGT GAATACTGCG CATGGAGAAG CAGCCAGTAA

651 AATCAAACAG TTGGATCAGC ACTACATTAC CCACAAGATT GCCCaTGCCA

701 TAGCGGGCTG TGCGGcTGCG GCGGCGAATA AGGGCAAGTG TCAGGATGGT

751 GCGATAgGTG CGGCTGTGGG CGAGATAGTC GGGGAgGCTT TGACAAACGG

801 CAAAAATCCT GACACTTTGA CAGCTAAAgA ACGCGaACAG ATTTTGGCAT

851 ACAGCAAACT GGTTGCCGGT ACGGTAAGCG GTGTGGTCGG CGGCGATGTA

901 AATGCGGCGG CGAATGCGGC TGAGGTAGCG GTGAAAAATA ATCAGCTTAG

951 CGACAAAtGA

它对应于氨基酸序列<SEQ ID 68；ORF41>：

1 ..QCRLKSSQFY RRHLLCKYIY RFPIYCPXAC VAEDTPYACY LXQLQVTKDV

51 NWNQVXLAYD KWDYKQEG LT GAGAAIIALA VTVVTAGAGA GAALGLNGAA

101 AAATDAAFAS LASQASVSLI NNKGNIGNTL KELGRSSTVK NLMVAVATAG

151 VADKIGASAL NNVSDKQWIN NLTVNLANAG SAALINTAVN GGSLKDNLEA

201 NILAALVNTA HGEAASKIKQ LDQHYITHKI AHAIAGCAAA AANKGKCQDG

251 AIGAAVGEIV GEALTNGKNP DTLTAKEREQ ILAYSKLVAG TVSGVVGGDV

301 NAAANAAEVA VKNNQLSDK*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 69>：

1 ATGCAAGTAA ATATTCAGAT TCCCTATATA CTGCCCAGAT GCGTGCGTGC

51 TGAAGACACC CCCTACGCTT GCTATTTGAA ACAGCTCCAA GTCACCAAAG

101 ACGTCAACTG GAACCAGGTA CAACTGGCGT ACGACAAATG GGACTATAAA

151 CAGGAAGGCT TAACCGGAGC CGGAGCAGCG ATTATTGCGC TGGCTGTTAC

201 CGTGGTTACT GCGGGCGCGG GAGCCGGAGC CGCACTGGGC TTAAACGGCG

251 CGGCCGCAGC GGCAACCGAT GCCGCATTCG CCTCGCTGGC CAGCCAGGCT

301 TCCGTATCGC TCATCAACAA CAAAGGCAAT ATCGGTAACA CCCTGAAAGA

351 GCTGGGCAGA AGCAGCACGG TGAAAAATCT GATGGTTGCC GTCGCTACCG

401 CAGGCGTAGC CGACAAAATC GGTGCTTCGG CACTGAACAA TGTCAGCGAT

451 AAGCAGTGGA TCAACAACCT GACCGTCAAC CTGGCCAATG CGGGCAGTGC

501 CGCACTGATT AATACCGCTG TCAACGGCGG CAGCCTGAAA GACAATCTGG

551 AAGCGAATAT CCTTGCGGCT TTGGTGAATA CTGCGCATGG AGAAGCAGCC

601 AGTAAAATCA AACAGTTGGA TCAGCACTAC ATTACCCACA AGATTGCCCA

651 TGCCATAGCG GGCTGTGCGG CTGCGGCGGC GAATAAGGGC AAGTGTCAGG

701 ATGGTGCGAT AGGTGCGGCT GTGGGCGAGA TAGTCGGGGA GGCTTTGACA

751 AACGGCAAAA ATCCTGACAC TTTGACAGCT AAAGAACGCG AACAGATTTT

801 GGCATACAGC AAACTGGTTG CCGGTACGGT AAGCGGTGTG GTCGGCGGCG

851 ATGTAAATGC GGCGGCGAAT GCGGCTGAGG TAGCGGTGAA AAATAATCAG

901 CTTAGCGACA AAGAGGGTAG AGAATTTGAT AACGAAATGA CTGCATGCGC

951 CAAACAGAAT AATCCTCAAC TGTGCAGAAA AAATACTGTA AAAAAGTATC

1001 AAAATGTTGC TGATAAAAGA CTTGCTGCTT CGATTGCAAT ATGTACGGAT

1051 ATATCCCGTA GTACTGAATG TAGAACAATC AGAAAACAAC ATTTGATCGA

1101 TAGTAGAAGC CTTCATTCAT CTTGGGAAGC AGGTCTAATT GGTAAAGATG

1151 ATGAATGGTA TAAATTATTC AGCAAATCTT ACACCCAAGC AGATTTGGCT

1201 TTACAGTCTT ATCATTTGAA TACTGCTGCT AAATCTTGGC TTCAATCGGG

1251 CAATACAAAG CCTTTATCCG AATGGATGTC CGACCAAGGT TATACACTTA

1301 TTTCAGGAGT TAATCCTAGA TTCATTCCAA TACCAAGAGG GTTTGTAAAA

1351 CAAAATACAC CTATTACTAA TGTCAAATAC CCGGAAGGCA TCAGTTTCGA

1401 TACAAACCTA AAAAGACATC TGGCAAATGC TGATGGTTTT AGTCAAAAAC

1451 AGGGCATTAA AGGAGCCCAT AACCGCACCA ATTTTATGGC AGAACTAAAT

1501 TCACGAGGAG GACGCGTAAA ATCTGAAACC CAAACTGATA TTGAAGGCAT

1551 TACCCGAATT AAATATGAGA TTCCTACACT AGACAGGACA GGTAAACCTG

1601 ATGGTGGATT TAAGGAAATT TCAAGTATAA AAACTGTTTA TAATCCTAAA

1651 AAATTTTCTG ATGATAAAAT ACTTCAAATG GCTCAAAATG CTGCTTCACA

1701 AGGATATTCA AAAGCCTCTA AAATTGCTCA AAATGAAAGA ACTAAATCAA

1751 TATCGGAAAG AAAAAATGTC ATTCAATTCT CAGAAACCTT TGACGGAATC

1801 AAATTTAGAT CATATTTTGA TGTAAATACA GGAAGAATTA CAAACATTCA

1851 CCCAGAATAA

它对应于氨基酸序列<SEQ ID 70；ORF41-1>：

1 MQVNIQIPYI LPRCVRAEDT PYACYLKQLQ VTKDVNWNQV QLAYDKWDYK

51 QEGLTG AGAA IIALAVTVVT AGAGAGAALG LNGAAAAATD AAFASLASQA

101 SVSLINNKGN IGNTLKELGR SSTVKNLMVA VATAGVADKI GASALNNVSD

151 KQWINNLTVN LANAGSAALI NTAVNGGSLK DNLEANILAA LVNTAHGEAA

201 SKIKQLDQHY ITHKIAHAIA GCAAAAANKG KCQDGAIGAA VGEIVGEALT

251 NGKNPDTLTA KEREQILAYS KLVAGTVSGV VGGDVNAAAN AAEVAVKNNQ

301 LSDKEGREFD NEMTACAKQN NPQLCRKNTV KKYQNVADKR LAASIAICTD

351 ISRSTECRTI RKQHLIDSRS LHSSWEAGLI GKDDEWYKLF SKSYTQADLA

401 LQSYHLNTAA KSWLQSGNTK PLSEWMSDQG YTLISGVNPR FIPIPRGFVK

451 QNTPITNVKY PEGISFDTNL KRHLANADGF SQKQGIKGAH NRTNFMAELN

501 SRGGRVKSET QTDIEGITRI KYEIPTLDRT GKPDGGFKEI SSIKTVYNPK

551 KFSDDKILQM AQNAASQGYS KASKIAQNER TKSISERKNV IQFSETFDGI

601 KFRSYFDVNT GRITNIHPE*

该氨基酸序列的计算机分析预计了一个跨膜结构域，并且还发现与脑膜炎奈瑟氏球菌(菌株A)的ORF的同源性。

ORF41显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF41a)重叠的279个氨基酸内有92.8％的相同性：

10 20 30 40 50 60 69

orf41.pep YRRHLLCKYIYRFPIYCPXACVAEDTPYACYLXQLQVTKDVNWNQVXLAYDKWDYKQEGL

|| ||||:|::||||| ||||:||||||||

orf41a YLKQLQVAKNINWNQVQLAYDRWDYKQEGL

10 20 30

70 80 90 100 110 120 129

orf41.pep TG AGAAIIALAVTVVTAGAGAGAALGLNGAAAAATDAAFASLASQASVSLINNKGNIGNT

| ||||||||||||||:|| |:||:|||||| ||||||||||||||||||:|||||::|:|

orf41a TE AGAAIIALAVTVVTSGAGTGAVLGLNGAXAAATDAAFASLASQASVSFINNKGDVGKT

40 50 60 70 80 90

130 140 150 160 170 180 189

orf41.pep LKELGRSSTVKNLMVAVATAGVADKIGASALNNVSDKQWINNLTVNLANAGSAALINTAV

|||||||||||||:||:|||||||||||||| ||||||||||||||||||||||||||||

orf41a LKELGRSSTVKNLVVAAATAGVADKIGASALXNVSDKQWINNLTVNLANAGSAALINTAV

100 110 120 130 140 150

190 200 210 220 230 240 249

orf41.pep NGGSLKDNLEANILAALVNTAHGEAASKIKQLDQHYITHKIAHAIAGCAAAAANKGKCQD

||||||| |||||||||||||||||||||||||||||:||||||||||||||||||||||

orf41a NGGSLKDXLEANILAALVNTAHGEAASKIKQLDQHYIVHKIAHAIAGCAAAAANKGKCQD

160 170 180 190 200 210

250 260 270 280 290 300 309

orf41.pep GAIGAAVGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVSGVVGGDVNAAANAAEV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf41a GAIGAAVGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVSGVVGGDVNAAANAAEV

220 230 240 250 260 270

310 320

orf41.pep AVKNNQLSDKX

|||||||||

orf41a AVKNNQLSDXEGREFDNEMTACAKQNXPQLCRKNTVKKYQNVADKRLAASIAICTDISRS

280 290 300 310 320 330

ORF41a的部分核苷酸序列是<SEQ ID 71>：

1 ..TATCTGAAAC AGCTCCAAGT AGCGAAAAAC ATCAACTGGA ATCAGGTGCA

51 GCTTGCTTAC GACAGATGGG ACTACAAACA GGAGGGCTTA ACCGAAGCAG

101 GTGCGGCGAT TATCGCACTG GCCGTTACCG TGGTCACCTC AGGCGCAGGA

151 ACCGGAGCCG TATTGGGATT AAACGGTGCG NCCGCCGCCG CAACCGATGC

201 AGCATTCGCC TCTTTGGCCA GCCAGGCTTC CGTATCGTTC ATCAACAACA

251 AAGGCGATGT CGGCAAAACC CTGAAAGAGC TGGGCAGAAG CAGCACGGTG

301 AAAAATCTGG TGGTTGCCGC CGCTACCGCA GGCGTAGCCG ACAAAATCGG

351 CGCTTCGGCA CTGANCAATG TCAGCGATAA GCAGTGGATC AACAACCTGA

401 CCGTCAACCT AGCCAATGCG GGCAGTGCCG CACTGATTAA TACCGCTGTC

451 AACGGCGGCA GCCTGAAAGA CANTCTGGAA GCGAATATCC TTGCGGCTTT

501 GGTCAATACC GCGCATGGAG AAGCAGCCAG TAAAATCAAA CAGTTGGATC

551 AGCACTACAT AGTCCACAAG ATTGCCCATG CCATAGCGGG CTGTGCGGCA

601 GCGGCGGCGA ATAAGGGCAA GTGTCAGGAT GGTGCGATAG GTGCGGCTGT

651 GGGCGAGATA GTCGGGGAGG CTTTGACAAA CGGCAAAAAT CCTGACACTT

701 TGACAGCTAA AGAACGCGAA CAGATTTTGG CATACAGCAA ACTGGTTGCC

751 GGTACGGTAA GCGGTGTGGT CGGCGGCGAT GTAAATGCGG CGGCGAATGC

801 GGCTGAGGTA GCGGTGAAAA ATAATCAGCT TAGCGACNAA GAGGGTAGAG

851 AATTTGATAA CGAAATGACT GCATGCGCCA AACAGAATAN TCCTCAACTG

901 TGCAGAAAAA ATACTGTAAA AAAGTATCAA AATGTTGCTG ATAAAAGACT

951 TGCTGCTTCG ATTGCAATAT GTACGGATAT ATCCCGTAGT ACTGAATGTA

1001 GAACAATCAG AAAACAACAT TTGATCGATA GTAGAAGCCT TCATTCATCT

1051 TGGGAAGCAG GTCTAATTGG TAAAGATGAT GAATGGTATA AATTATTCAG

1101 CAAATCTTAC ACCCAAGCAG ATTTGGCTTT ACAGTCTTAT CATTTGAATA

1151 CTGCTGCTAA ATCTTGGCTT CAATCGGGCA ATACAAAGCC TTTATCCGAA

1201 TGGATGTCCG ACCAAGGTTA TACACTTATT TCAGGAGTTA ATCCTAGATT

1251 CATTCCAATA CCAAGAGGGT TTGTAAAACA AAATACACCT ATTACTAATG

1301 TCAAATACCC GGAAGGCATC AGTTTCGATA CAAACCTANA AAGACATCTG

1351 GCAAATGCTG ATGGTTTTAG TCAAGAACAG GGCATTAAAG GAGCCCATAA

1401 CCGCACCAAT NTTATGGCAG AACTAAATTC ACGAGGAGGA NGNGTAAAAT

1451 CTGAAACCCA NACTGATATT GAAGGCATTA CCCGAATTAA ATATGAGATT

1501 CCTACACTAG ACAGGACAGG TAAACCTGAT GGTGGATTTA AGGAAATTTC

1551 AAGTATAAAA ACTGTTTATA ATCCTAAAAA NTTTTNNGAT GATAAAATAC

1601 TTCAAATGGC TCAANATGCT GNTTCACAAG GATATTCAAA AGCCTCTAAA

1651 ATTGCTCAAA ATGAAAGAAC TAAATCAATA TCGGAAAGAA AAAATGTCAT

1701 TCAATTCTCA GAAACCTTTG ACGGAATCAA ATTTAGANNN TATNTNGATG

1751 TAAATACAGG AAGAATTACA AACATTCACC CAGAATAA

它编码的蛋白质具有部分氨基酸序列<SEQ ID 72>：

1 YLKQLQVAKN INWNQVQLAY DRWDYKQEGL TE AGAAIIAL AVTVVTSGAG

51 TGAVLGLNGA XAAATDAAFA SLASQASVSF INNKGDVGKT LKELGRSSTV

101 KNLVVAAATA GVADKIGASA LXNVSDKQWI NNLTVNLANA GSAALINTAV

151 NGGSLKDXLE ANILAALVNT AHGEAASKIK QLDQHYIVHK IAHAIAGCAA

201 AAANKGKCQD GAIGAAVGEI VGEALTNGKN PDTLTAKERE QILAYSKLVA

251 GTVSGVVGGD VNAAANAAEV AVKNNQLSDX EGREFDNEMT ACAKQNXPQL

301 CRKNTVKKYQ NVADKRLAAS IAICTDISRS TECRTIRKQH LIDSRSLHSS

351 WEAGLIGKDD EWYKLFSKSY TQADLALQSY HLNTAAKSWL QSGNTKPLSE

401 WMSDQGYTLI SGVNPRFIPI PRGFVKQNTP ITNVKYPEGI SFDTNLXRHL

451 ANADGFSQEQ GIKGAHNRTN XMAELNSRGG XVKSETXTDI EGITRIKYEI

501 PTLDRTGKPD GGFKEISSIK TVYNPKXFXD DKILQMAQXA XSQGYSKASK

551 IAQNERTKSI SERKNVIQFS ETFDGIKFRX YXDVNTGRIT NIHPE*

ORF41a和ORF41-1显示在595个重叠的氨基酸内有94.8％的相同性：

10 20 30

orf41a.pep YLKQLQVAKNINWNQVQLAYDRWDYKQEGLTEAGAA

|||||||:|::||||||||||:||||||||| ||||

orf41-1 MQVNIQIPYILPRCVRAEDTPYACYLKQLQVTKDVNWNQVQLAYDKWDYKQEGLTGAGAA

10 20 30 40 50 60

40 50 60 70 80 90

orf41a.pep IIALAVTVVTSGAGTGAVLGLNGAXAAATDAAFASLASQASVSFINNKGDVGKTLKELGR

||||||||||:|||:||:|||||| ||||||||||||||||||:|||||::|:|||||||

orf41-1 IIALAVTVVTAGAGAGAALGLNGAAAAATDAAFASLASQASVSLINNKGNIGNTLKELGR

70 80 90 100 110 120

100 110 120 130 140 150

orf41a.pep SSTVKNLVVAAATAGVADKIGASALXNVSDKQWINNLTVNLANAGSAALINTAVNGGSLK

|||||||:||:|||||||||||||| ||||||||||||||||||||||||||||||||||

orf41-1 SSTVKNLMVAVATAGVADKIGASALNNVSDKQWINNLTVNLANAGSAALINTAVNGGSLK

130 140 150 160 170 180

160 170 180 190 200 210

orf41a.pep DXLEANILAALVNTAHGEAASKIKQLDQHYIVHKIAHAIAGCAAAAANKGKCQDGAIGAA

| |||||||||||||||||||||||||||||:||||||||||||||||||||||||||||

orf41-1 DNLEANILAALVNTAHGEAASKIKQLDQHYITHKIAHAIAGCAAAAANKGKCQDGAIGAA

190 200 210 220 230 240

220 230 240 250 260 270

orf41a.pep VGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVSGVVGGDVNAAANAAEVAVKNNQ

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf41-1 VGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVSGVVGGDVNAAANAAEVAVKNNQ

250 260 270 280 290 300

280 290 300 310 320 330

orf41a.pep LSDXEGREFDNEMTACAKQNXPQLCRKNTVKKYQNVADKRLAASIAICTDISRSTECRTI

||| |||||||||||||||| |||||||||||||||||||||||||||||||||||||||

orf41-1 LSDKEGREFDNEMTACAKQNNPQLCRKNTVKKYQNVADKRLAASIAICTDISRSTECRTI

310 320 330 340 350 360

340 350 360 370 380 390

orf41a.pep RKQHLIDSRSLHSSWEAGLIGKDDEWYKLFSKSYTQADLALQSYHLNTAAKSWLQSGNTK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf41-1 RKQHLIDSRSLHSSWEAGLIGKDDEWYKLFSKSYTQADLALQSYHLNTAAKSWLQSGNTK

370 380 390 400 410 420

400 410 420 430 440 450

orf41a.pep PLSEWMSDQGYTLISGVNPRFIPIPRGFVKQNTPITNVKYPEGISFDTNLXRHLANADGF

|||||||||||||||||||||||||||||||||||||||||||||||||| |||||||||

orf41-1 PLSEWMSDQGYTLISGVNPRFIPIPRGFVKQNTPITNVKYPEGISFDTNLKRHLANADGF

430 440 450 460 470 480

460 470 480 490 500 510

orf41a.pep SQEQGIKGAHNRTNXMAELNSRGGXVKSETXTDIEGITRIKYEIPTLDRTGKPDGGFKEI

||:||||||||||| ||||||||| |||||| ||||||||||||||||||||||||||||

orf41-1 SQKQGIKGAHNRTNFMAELNSRGGRVKSETQTDIEGITRIKYEIPTLDRTGKPDGGFKEI

490 500 510 520 530 540

520 530 540 550 560 570

orf41a.pep SSIKTVYNPKXFXDDKILQMAQXAXSQGYSKASKIAQNERTKSISERKNVIQFSETFDGI

|||||||||| | ||||||||| | |||||||||||||||||||||||||||||||||||

orf41-1 SSIKTVYNPKKFSDDKILQMAQNAASQGYSKASKIAQNERTKSISERKNVIQFSETFDGI

550 560 570 580 590 600

580 590

orf4 1a.pep KFRXYXDVNTGRITNIHPEX

||| | ||||||||||||||

orf41-1 KFRSYFDVNTGRITNIHPEX

610 620

如上所述扩增ORF41-1的氨基酸25-619。图6显示了ORF41-1的亲水性曲线、抗原性指数和AMPHI区域。

实施例17

在脑膜炎奈瑟氏球菌中鉴定出下列DNA序列<SEQ ID 73>

1 ATGGCAATCA TTACATTGTA TTATTCTGTC AATGGTATTT TAAATGTATG

51 TGCAAAAGCA AAAAATATTC AAGTAGTTGC CAATAATAAG AATATGGTTC

101 TTTTTGGGTT TTTGGsmrGC ATCATCGGCG GTTCAACCAA TGCCATGTCT

151 CCCATATTGT TAATATTTTT GCTTAGCGAA ACAGAAAATA AAAATcgTAT

201 CGTAAAATCA AGCAATCTAT GCTATCTTTT GGCGAAAATT GTTCAAATAT

251 ATATGCTAAG AGACCAGTAT TGGTTATTAA ATAAGAGTGA ATACGdTTTA

301 ATATTTTTAC TGTCCGTATT GTCTGTTATT GGATTGTATG TTGGAATTCG

351 GTTAAGGACT AAGATTAGCC CAaATTTTTT TAAAATGTTA ATTTTTATTG

401 tTTTATTGGT ATTGGCtCTG AAAATCGGGC AttCGGGTTT AAtCAAACTT

451 TAA

它对应于氨基酸序列<SEQ ID 74；ORF51>：

1 MAIITLYYSV NGILNVCAKA KNIQVVANNK NMVLFG FLXX IIGGSTNAMS

51 PILLIFLLSE TENKNRIVKS SNLCYLLAKI VQIYMLRDQY WLLNKS EYXL

101 IFLLSVLSVI GLYVGIRLRT KI SPNFFKML IFIVLLVLAL KIGHSGLIKL

151 *

进一步的工作揭示了完整的核苷酸序列<SEQ ID 75>：

1 ATGCAAGAAA TAATGCAATC TATCGTTTTT GTTGCTGCCG CAATACTGCA

51 CGGAATTACA GGCATGGGAT TTCCGATGCT CGGTACAACC GCATTGGCTT

101 TTATCATGCC ATTGTCTAAG GTTGTTGCCT TGGTGGCATT ACCAAGCCTG

151 TTAATGAGCT TGTTGGTTCT ATGCAGCAAT AACAAAAAGG GTTTTTGGCA

201 AGAGATTGTT TATTATTTAA AAACCTATAA ATTGCTTGCT ATCGGCAGCG

251 TCGTTGGCAG CATTTTGGGG GTGAAGTTGC TTTTGATACT TCCAGTGTCT

301 TGGCTGCTTT TACTGATGGC AATCATTACA TTGTATTATT CTGTCAATGG

351 TATTTTAAAT GTATGTGCAA AAGCAAAAAA TATTCAAGTA GTTGCCAATA

401 ATAAGAATAT GGTTCTTTTT GGGTTTTTGG CAGGCATCAT CGGCGGTTCA

451 ACCAATGCCA TGTCTCCCAT ATTGTTAATA TTTTTGCTTA GCGAAACAGA

501 AAATAAAAAT CGTATCGTAA AATCAAGCAA TCTATGCTAT CTTTTGGCGA

551 AAATTGTTCA AATATATATG CTAAGAGACC AGTATTGGTT ATTAAATAAG

601 AGTGAATACG GTTTAATATT TTTACTGTCC GTATTGTCTG TTATTGGATT

651 GTATGTTGGA ATTCGGTTAA GGACTAAGAT TAGCCCAAAT TTTTTTAAAA

701 TGTTAATTTT TATTGTTTTA TTGGTATTGG CTCTGAAAAT CGGGCATTCG

751 GGTTTAATCA AACTTTAA

它对应于氨基酸序列<SEQ ID 76；ORF5 1-1>：

1 MQEIMQSIVF VAAAILHGIT GMGFPMLGTT ALAFIMPLSK V VALVALPSL

51 LMSLLVLCSN NKKGFWQEIV YYLKTYKLLA IGSVVGSILG VK LLLILPVS

101 WLLLLMAIIT LYYSVNGILN VCAKAKNIQV VANNKNMVLF GFLAG IIGGS

151 TNAMSPILLI FLLSETENKN RIVKSSNLCY LLAKIVQIYM LRDQYWLLNK

201 SEYG LIFLLS VLSVIGLYVG IRLRTKISPN FFKMLIFIVL LVLALKIGHS

251 GLIKL*

该氨基酸序列的计算机分析揭示了三个推定的跨膜结构域。还鉴定了一个脑膜炎奈瑟氏球菌菌株A的相应ORF：

与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性

ORF51显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF51a)重叠的150个氨基酸内有96.7％的相同性：

10 20 30

orf51.pep MAIITLYYSVNGILNVCAKAKNIQVVANNK

|||| ||||||||||||||||||||||||||

orf51a YKLLAIGSVVGSILGVK LLLILPVSWLLLLMAIITLYYSVNGILNVCAKAKNIQVVANNK

80 90 100 110 120 130

40 50 60 70 80 90

orf51.pep NMVLFGFLXX IIGGSTNAMSPILLIFLLSETENKNRIVKSSNLCYLLAKIVQIYMLRDQY

|||||||| ||||||||||||||||| ||||||||||:||||||||||||||||||||||

orf51a NMVLFGFLAG IIGGSTNAMSPILLIFLLSETENKNRIAKSSNLCYLLAKIVQIYMLRDQY

140 150 160 170 180 190

100 110 120 130 140 150

orf51.pep WLLNKSEYX LIFLLSVLSVIGLYVGIRLRTKISPN FFKMLIFIVLLVLALKIGHSGLIKL

|||||||| ||||||||||||||||| ||||||||| ||||||||||||||||| |:||||||

orf51a WLLNKSEYG LIFLLSVLSVIGLYVGIRLRTKISPN FFKMLIFIVLLVLALKIGYSGLIKL

200 210 220 230 240 250

ORF51-1和ORF51a显示在255个重叠的氨基酸内有99.2％的相同性：

orf51a.pep MQEIMQSIVFVAAAILHGITGMGFPMLGTTALAFIMPLSKVVALVALPSLLMSLLVLCSN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf51-1 MQEIMQSIVFVAAAILHGITGMGFPMLGTTALAFIMPLSKVVALVALPSLLMSLLVLCSN

orf51a.pep NKKGFWQEIVYYLKTYKLLAIGSVVGSILGVKLLLILPVSWLLLLMAIITLYYSVNGILN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf51-1 NKKGFWQEIVYYLKTYKLLAIGSVVGSILGVKLLLILPVSWLLLLMAIITLYYSVNGILN

orf51a.pep VCAKAKNIQVVANNKNMVLFGFLAGIIGGSTNAMSPILLIFLLSETENKNRIAKSSNLCY

||||||||||||||||||||||||||||||||||||||||||||||||||||:|||||||

orf51-1 VCAKAKNIQVVANNKNMVLFGFLAGIIGGSTNAMSPILLIFLLSETENKNRIVKSSNLCY

orf51a.pep LLAKIVQIYMLRDQYWLLNKSEYGLIFLLSVLSVIGLYVGIRLRTKISPNFFKMLIFIVL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf51-1 LLAKIVQIYMLRDQYWLLNKSEYGLIFLLSVLSVIGLYVGIRLRTKISPNFFKMLIFIVL

orf51a.pep LVLALKIGYSGLIKLX

||||||||:|||||||

orf51-1 LVLALKIGHSGLIKLX

全长ORF51a的核苷酸序列是<SEQ ID 77>：

1 ATGCAAGAAA TAATGCAATC TATCGTTTTT GTTGCTGCCG CAATACTGCA

51 CGGAATTACA GGCATGGGAT TTCCGATGCT CGGTACAACC GCATTGGCTT

101 TTATCATGCC ATTGTCTAAG GTTGTTGCCT TGGTGGCATT ACCAAGCCTG

151 TTAATGAGCT TGTTGGTTCT ATGCAGCAAT AACAAAAAGG GTTTTTGGCA

201 AGAGATTGTT TATTATTTAA AAACCTATAA ATTGCTTGCT ATCGGCAGCG

251 TCGTTGGCAG CATTTTGGGG GTGAAGTTGC TTTTGATACT TCCAGTGTCT

301 TGGCTGCTTT TACTGATGGC AATCATTACA TTGTATTATT CTGTCAATGG

351 TATTTTAAAT GTATGTGCAA AAGCAAAAAA TATTCAAGTA GTTGCCAATA

401 ATAAGAATAT GGTTCTTTTT GGGTTTTTGG CAGGCATCAT CGGCGGTTCA

451 ACCAATGCCA TGTCTCCCAT ATTGTTAATA TTTTTGCTTA GCGAAACAGA

501 GAATAAAAAT CGTATCGCAA AATCAAGCAA TCTATGCTAT CTTTTGGCAA

551 AAATTGTTCA AATATATATG CTAAGAGACC AGTATTGGTT ATTAAATAAG

601 AGTGAATACG GTTTAATATT TTTACTGTCC GTATTGTCTG TTATTGGATT

651 GTATGTTGGA ATTCGGTTAA GGACTAAGAT TAGCCCAAAT TTTTTTAAAA

701 TGTTAATTTT TATTGTTTTA TTGGTATTGG CTCTGAAAAT CGGGTATTCA

751 GGTTTAATCA AACTTTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 78>：

1 MQEIMQSIVF VAAAILHGIT GMGFPMLGTT ALAFIMPLSK V VALVALPSL

51 LMSLLVLCSN NKKGFWQEIV YYLKTYKLLA IGSVVGSILG VK LLLILPVS

101 WLLLLMAIIT LYYSVNGILN VCAKAKNIQV VANNKNMVLF GFLAG IIGGS

151 TNAMSPILLI FLLSETENKN RIAKSSNLCY LLAKIVQIYM LRDQYWLLNK

201 SEYG LIFLLS VLSVIGLYVG IRLRTKISPN FFKMLIFIVL LVLALKIGYS

251 GLIKL*

实施例18

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 79>

1 ATGAGACATA TGAAAATACA AAATTATTTA CTAGTATTTA TAGTTTTACA

51 TATAGCCTTG ATAGTAATTA ATATAGTGTT TGGTTATTTT GTTTTTCTAT

101 TTGATTTTTT TGCGTTTTTG TTTTTTGCAA AGGTCTTTCT TGCTGTAAAT

151 TTATTATTTT TAGAAAAAAA CATAAAAAAC AAATTATTGT TTTTATTGCC

201 GATTTCTATT ATTATATGGA TGGTAATTCA TATTAGTATG ATAAATATAA

251 AATTTTATAA ATTTGAGCAT CAAATAAAGG AACAAAATAT ATCCTCGATT

301 ACTGGGGTGA TAAAACCACA TGATAGTTAT AATTATGTTT ATGACTCAAA

351 TGGATATGCT AAATTAAAAG ATAATCATAG ATATGGTAGG GTAATTAGAG

401 AAACACCTTA TATTGATGTA GTTGCATCTG ATGTTAAAAA TAAATCCATA

451 AGATTAAGCT TGGTTTGTGG TATTCATTCA TATGCTCCAT GTGCCAATTT

501 TATAAAATTT GTCAGG..

它对应于氨基酸序列<SEQ ID 80；ORF82>：

1 MRHMKIQNYL LVFIVLHIAL IVINIVFGYF VFLFDFFAFL FFANVFLAVN

51 LLFLEKNIKN KLLFLLPISI IIWMVIHISM INIKFYKFEH QIKEQNISSI

101 TGVIKPHDSY NYVYDSNGYA KLKDNHRYGR VIRETPYIDV VASDVKNKSI

151 RLSLVCGIHS YAPCANFIKF VR..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 81>：

1 ATGAGACATA TGAAAAATAA AAATTATTTA CTAGTATTTA TAGTTTTACA

51 TATAGCCTTG ATAGTAATTA ATATAGTGTT TGGTTATTTT GTTTTTCTAT

101 TTGATTTTTT TGCGTTTTTG TTTTTTGCAA ACGTCTTTCT TGCTGTAAAT

151 TTATTATTTT TAGAAAAAAA CATAAAAAAC AAATTATTGT TTTTATTGCC

201 GATTTCTATT ATTATATGGA TGGTAATTCA TATTAGTATG ATAAATATAA

251 AATTTTATAA ATTTGAGCAT CAAATAAAGG AACAAAATAT ATCCTCGATT

301 ACTGGGGTGA TAAAACCACA TGATAGTTAT AATTATGTTT ATGACTCAAA

351 TGGATATGCT AAATTAAAAG ATAATCATAG ATATGGTAGG GTAATTAGAG

401 AAACACCTTA TATTGATGTA GTTGCATCTG ATGTTAAAAA TAAATCCATA

451 AGATTAAGCT TGGTTTGTGG TATTCATTCA TATGCTCCAT GTGCCAATTT

501 TATAAAATTT GCAAAAAAAC CTGTTAAAAT TTATTTTTAT AATCAACCTC

551 AAGGAGATTT TATAGATAAT GTAATATTTG AAATTAATGA TGGAAACAAA

601 AGTTTGTACT TGTTAGATAA GTATAAAACA TTTTTTCTTA TTGAAAACAG

651 TGTTTGTATC GTATTAATTA TTTTATATTT AAAATTTAAT TTGCTTTTAT

701 ATAGGACTTA CTTCAATGAG TTGGAATAG

它对应于氨基酸序列<SEQ ID 82；ORF82-1>：

1 MRHMKNKNYL LVFIVLHIAL IVINIVFGYF VFLFDFFAFL FFANVFLAVN

51 LLFLEKNIKN K LLFLLPISI IIWMVIHISM INIKFYKFEH QIKEQNISSI

101 TGVIKPHDSY NYVYDSNGYA KLKDNHRYGR VIRETPYIDV VASDVKNKSI

151 RLSLVCGIHS YAPCANFIKF AKKPVKIYFY NQPQGDFIDN VIFEINDGNK

201 SLYLLDKYKT FFLIENSVCI VLIILYLKFN LLLYRTYFNE LE*

该氨基酸序列的计算机分析揭示了一个预计的前导肽。

还鉴定了一个脑膜炎奈瑟氏球菌菌株A的一个相应的ORE：

与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性

ORF82显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF82a)重叠的172个氨基酸内有97.1％的相同性：

10 20 30 40 50 60

orf82.pep MRHMKIQNYLLVFIVLHIALIVINIVFGYFVFLFDFFAFLFFANVFLAVNLLFLEKNIKN

||||| :|||||||||||:||||||||||||||||||||||||||||| ||||||||||||

orf82a MRHMKNKNYLLVFIVLHITLIVINIVFGYFVFLFDFFAFLFFANVFLAVNLLFLEKNIKN

10 20 30 40 50 60

70 80 90 100 110 120

orf82.pep K LLFLLPISIIIWMVIHISMINIKFYKFEHQIKEQNISSITGVIKPHDSYNYVYDSNGYA

| ||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf82a K LLFLLPISIIIWMVIHISMINIKFYKFEHQIKEQNISSITGVIKPHDSYNYVYDSNGYA

70 80 90 100 110 120

130 140 150 160 170

orf82.pep KLKDNHRYGRVIRETPYIDVVASDVKNKSIRLSLVCGIHSYAPCANFIKFVR

||||||||||||||||||||||||||||||||||||||||||||||||||::

orf82a KLKDNHRYGRVIRETPYIDVVASDVKNKSIRLSLVCGIHSYAPCANFIKFAKKPVKIYFY

130 140 150 160 170 180

ORF82a和ORF82-1显示在242个重叠的氨基酸内有99.2％的相同性：

orf82a.pep MRHMKNKNYLLVFIVLHITLIVINIVFGYFVFLFDFFAFLFFANVFLAVNLLFLEKNIKN

||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||

orf82-1 MRHMKNKNYLLVFIVLHIALIVINIVFGYFVFLFDFFAFLFFANVFLAVNLLFLEKNIKN

orf82a.pep KLLFLLPISIIIWMVIHISMINIKFYKFEHQIKEQNISSITGVIKPHDSYNYVYDSNGYA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf82-1 KLLFLLPISIIIWMVIHISMINIKFYKFEHQIKEQNISSITGVIKPHDSYNYVYDSNGYA

orf82a.pep KLKDNHRYGRVIRETPYIDVVASDVKNKSIRLSLVCGIHSYAPCANFIKFAKKPVKIYFY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf82-1 KLKDNHRYGRVIRETPYIDVVASDVKNKSIRLSLVCGIHSYAPCANFIKFAKKPVKIYFY

orf82a.pep NQPQGDFIDNVIFEINDGKKSLYLLDKYKTFFLIENSVCIVLIILYLKFNLLLYRTYFNE

||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||

orf82-1 NQPQGDFIDNVIFEINDGNKSLYLLDKYKTFFLIENSVCIVLIILYLKFNLLLYRTYFNE

orf82a.pep LEX

|||

orf82-1 LEX

全长ORF82a的核苷酸序列是<SEQ ID 83>：

1 ATGAGACATA TGAAAAATAA AAATTATTTA CTAGTATTTA TAGTTTTACA

51 TATAACCTTG ATAGTAATTA ATATAGTGTT TGGTTATTTT GTTTTTCTAT

101 TTGATTTTTT TGCGTTTTTG TTTTTTGCAA ACGTCTTTCT TGCTGTAAAT

151 TTATTATTTT TAGAAAAAAA CATAAAAAAC AAATTATTGT TTTTATTGCC

201 GATTTCTATT ATTATATGGA TGGTAATTCA TATTAGTATG ATAAATATAA

251 AATTTTATAA ATTTGAGCAT CAAATAAAGG AACAAAATAT ATCCTCGATT

301 ACTGGGGTGA TAAAACCACA TGATAGTTAT AATTATGTTT ATGACTCAAA

351 TGGATATGCT AAATTAAAAG ATAATCATAG ATATGGTAGG GTAATTAGAG

401 AAACACCTTA TATTGATGTA GTTGCATCTG ATGTTAAAAA TAAATCCATA

451 AGATTAAGCT TGGTTTGTGG TATTCATTCA TATGCTCCAT GTGCCAATTT

501 TATAAAATTT GCAAAAAAAC CTGTTAAAAT TTATTTTTAT AATCAACCTC

551 AAGGAGATTT TATAGATAAT GTAATATTTG AAATTAATGA TGGAAAAAAA

601 AGTTTGTACT TGTTAGATAA GTATAAAACA TTTTTTCTTA TTGAAAACAG

651 TGTTTGTATC GTATTAATTA TTTTATATTT AAAATTTAAT TTGCTTTTAT

701 ATAGGACTTA CTTCAATGAG TTGGAATAG

它编码的蛋白质具有氨基酸序列<SEQ ID 84>：

1 MRHMKNKNYL LVFIVLHITL IVINIVFGYF VFLFDFFAFL FFANVFLAVN

51 LLFLEKNIKN K LLFLLPISI IIWMVIHISM INIKFYKFEH QIKEQNISSI

101 TGVIKPHDSY NYVYDSNGYA KLKDNHRYGR VIRETPYIDV VASDVKNKSI

151 RLSLVCGIHS YAPCANFIKF AKKPVKIYFY NQPQGDFIDN VIFEINDGKK

201 SLYLLDKYKT FFLIENSVCI VLIILYLKFN LLLYRTYFNE LE*

实施例19

在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 85>

1 ..ACCCCCAACA GCGTGACCGT CTTGCCGTCT TTCGGCGGAT TCGGGCGTAC

51 CGGCGCGACC ATCAATGCAG CAGGCGGGGT CGGCATGACT GCCTTTTCGA

101 CAACCTTAAT TTCCGTAGCC GAGGGCGCGG TTGTAGAGCT GCAGGCCGTG

151 AGAGCCAAAG CCGTCAATGC AACCGCCGCT TGCATTTTTA CGGTCTTGAG

201 TAAGGACATT TTCGATTTCC TTTTTATTTT CCGTTTTCAG ACGGCTGACT

251 TCCGCCTGTA TTTTCGCCAA AGCCATGCCG ACAGCGTGCG CCTTGACTTC

301 ATATTTAAAA GCTTCCGCGC GTGCCAGTTC CAGTTCGCGC GCATAGTTTT

351 GAGCCGACAA CAGCAGGGCT TGCGCCTTGT CGCGCTCCAT CTTGTCGATG

401 ACCGCCTGCA GCTTCGCAAA TGCCGACTTG TAGCCTTGAT GGTGCGACAC

451 AGCCAAGCCC GTGCCGACAA GCGCGATAAT GGCAATCGGT TGCCAGTAAT

501 TCGCCAGCAG TTTCACGAGA TTCATTCTCG ACCTCCTGAC GCTTCACGCT

551 GA

它对应于氨基酸序列<SEQ ID 86；ORF 124>：

1 ..TPNSVTVLPS FGGFGRTGAT INAAGGVGMT AFSTTLISVA EGAVVELQAV

51 RAKAVNATAA CIFTVLSKDI FDFLFIFRFQ TADFRLYFRQ SHADSVRLDF

101 IFKSFRACQF QFARIVLSRQ QQGLRLVALH LVDDRLQLRK CRLVALMVRH

151 SQARADKRDN GNRLPVIRQQ FHEIHSRPPD ASR*

该氨基酸序列的计算机分析预计了一个跨膜结构域。

进一步的工作揭示了完整的核苷酸序列<SEQ ID 87>：

1 ATGACTGCCT TTTCGACAAC CTTAATTTCC GTAGCCGAGG GCGCGGTTGT

51 AGAGCTGCAG GCCGTGAGAG CCAAAGCCGT CAATGCAACC GCCGCTTGCA

101 TTTTTACGGT CTTGAGTAAG GACATTTTCG ATTTCCTTTT TATTTTCCGT

151 TTTCAGACGG CTGACTTCCG CCTGTTTTTT CGCCAAAGCC ATGCCGACAG

201 CGTGCGCCTT GACTTCATAT TTTTTAGCTT CCGCGCGTGC CAGTTCCAGT

251 TCGCGCGCAT AGTTTTGAGC CGACAACAGC AGGGCTTGCG CCTTGTCGCG

301 CTCCATCTTG TCGATGACCG CCTGCTGCTT CGCAAATGCC GACTTGTAGC

351 CTTGATGGTG CGACACAGCC AAGCCCGTGC CGACAAGCGC GATAATGGCA

401 ATCGGTTGCC AGTTATTCGC CAGCAGTTTC ACGAGATTCA TTCTCGACCT

451 CCTGACGCTT CACGCTGA

它对应于氨基酸序列<SEQ ID 88；ORF124-1>：

1 MTAFSTTLIS VAEGAVVELQ AVRAKAVNAT AA CIFTVLSK DIFDFLFIFR

51 FQTADFRLFF RQSHADSVRL DFIFFSFRAC QFQFARIVLS RQQQGLRLVA

101 LHLVDDRLLL RKCRLVALMV RHSQARADKR DNGNRLPVIR QQFHEIHSRP

151 PDASR*

还鉴定了脑膜炎奈瑟氏球菌菌株A的一个相应的ORF：

与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性

ORF124显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF124a)重叠的152个氨基酸内有87.5％的相同性：

10 20 30 40 50 60

orf124.pep TPNSVTVLPSFGGFGRTGATINAAGGVGMTAFSTTLISVAEGAVVELQAVRAKAVNATAA

|||||||||||||||:|||||| |||||:|||

orf124a MTAFSTTLISVAEGALVELQAVMAKAVNTTAA

10 20 30

70 80 90 100 110 120

orf124.pep CIFTVLSKDIFDFLFIFRFQTADFRLYFRQSHADSVRLDFIFKSFRACQFQFARIVLSRQ

||||||||||||||||||||||||||:|||||||:||||||| |||: |||| :|||||

orf124a CIFTVLSKDIFDFLFIFRFQTADFRLFFRQSHADGVRLDFIFFSFRTRLFQFAGVVLSRQ

40 50 60 70 80 90

130 140 150 160 170 180

orf124.pep QQGLRLVALHLVDDRLQLRKCRLVALMVRHSQARADKRDNGNRLPVIRQQFHEIHSRPPD

||||||||||:::||| ||| ||||||||| |:||||||:||||||||||||||||||||

orf124a QQGLRLVALHFLNDRLLLRKSRLVALMVRHRQTRADKRDDGNRLPVIRQQFHEIHSRPPD

100 110 120 130 140 150

orf124.pep ASRX

:

orf124a VX

ORF124a和ORF124-1显示在152个重叠的氨基酸内有89.5％的相同性：

orf124-1.pep MTAFSTTLISVAEGAVVELQAVRAKAVNATAACIFTVLSKDIFDFLFIFRFQTADFRLFF

|||||||||||||||:|||||| |||||:|||||||||||||||||||||||||||||||

orf124a MTAFSTTLISVAEGALVELQAVMAKAVNTTAACIFTVLSKDIFDFLFIFRFQTADFRLFF

orf124-1.pep RQSHADSVRLDFIFFSFRACQFQFARIVLSRQQQGLRLVALHLVDDRLLLRKCRLVALMV

||||||:|||||||||||: |||| :|||||||||||||||:::||||||| |||||||

orf124a RQSHADGVRLDFIFFSFRTRLFQFAGVVLSRQQQGLRLVALHFLNDRLLLRKSRLVALMV

orf124-1.pep RHSQARADKRDNGNRLPVIRQQFHEIHSRPPDASRX

|| |:||||||:||||||||||||||||||||:

orf124a RHRQTRADKRDDGNRLPVIRQQFHEIHSRPPDVX

全长ORF124a的核苷酸序列是<SEQ ID 89>：

1 ATGACCGCCT TTTCGACAAC CTTAATTTCC GTAGCCGAGG GCGCGCTTGT

51 AGAGCTGCAA GCCGTGATGG CCAAAGCCGT CAATACAACC GCCGCCTGCA

101 TTTTTACGGT CTTGAGTAAG GACATTTTCG ATTTCCTTTT TATTTTCCGT

151 TTTCAGACGG CTGACTTCCG CCTGTTTTTT CGCCAAAGCC ATGCCGACGG

201 CGTGCGCCTT GACTTCATAT TTTTTAGCTT CCGCACGCGC CTGTTCCAGT

251 TCGCGGGCGT AGTTTTGAGC CGACAACAGC AGGGCTTGCG CCTTGTCGCG

301 CTTCATTTTC TCAATGACCG CCTGCTGCTT CGCAAAAGCC GACTTGTAGC

351 CTTGATGGTG CGACACCGCC AAACCCGTGC CGACAAGCGC GATGATGGCA

401 ATCGGTTGCC AGTTATTCGC CAGCAGTTTC ACGAGATTCA TTCTCGACCT

451 CCTGACGTTT GA

它编码的蛋白质具有氨基酸序列<SEQ ID 90>：

1 MTAFSTTLIS VAEGALVELQ AVMAKAVNTT AA CIFTVLSK DIFDFLFIFR

51 FQTADFRLFF RQSHADGVRL DFIFFSFRTR LFQFAGVVLS RQQQGLRLVA

101 LHFLNDRLLL RKSRLVALMV RHRQTRADKR DDGNRLPVIR QQFHEIHSRP

151 PDV*

如上所述扩增ORF124-1。图7显示了ORF124-1的亲水性曲线、抗原性指数和AMPHI区域。

应理解本发明只是通过实施例作了描述，而在本发明的精神和范围内还可作改动。

表I-PCR引物

ORF	引物	序列	限制性位点
ORF	引物	序列	限制性位点	ORF38ORF40ORF41ORF44ORF51ORF52ORF56ORF69ORF82ORF114ORF124	正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向	CG CGGATCCCATATG-TCGCCGCAAAATTCCGACCCG CTCGAG-TTTTGCCGCGTTAAAAGCCG CGGATCCCATATG-ACCGTGAAGACCGCCCCCG CTCGAG-CCACTGATAACCGACAGACG CGGATCCCATATG-TATTTGAAACAGCTCCAAGCCCG CTCGAG-TTCTGGGTGAATGTTAG CGGATCCCATATG-GGCACGGACAACCCCCCCG CTCGAG-ACGTGGGGAACAGTCTG CGGATCCCATATG-AAAAATATTCAAGTAGTTGCCCCG CTCGAG-AAGTTTGATTAAACCCGCG CGGATCCCATATG-TGCCAACCGCAATCCGCCCG CTCGAG-TTTTTCCAGCTCCGGCAGC GGATCCCATATG-GTTATCGGAATATTACTCGCCCG CTCGAG-GGCTGCAGAAGCTGGCG CGGATCCCATATG-CGGACGTGGTTGGTTTTCCCG CTCGAG-ATATCTTCCGTTTTTTTCACCG CGGATCCGCTAGC-GTAAATTTATTATTTTTAGAACCCG CTCGAG-TTCCAACTCATTGAAGTACG CGGATCCCATATG-AATAAAGGTTTACATCGCATCCCG CTCGAG-AATCGCTGCACCGGCTCG CGGATCCCATATG-ACTGCCTTTTCGACACCCG CTCGAG-GCGTGAAGCGTCAGGA	BamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NheIXhoIBamHI-NheIXhoIBamHI-NheIXhoI

表II-克隆、表达和纯化

ORF	PCR/克隆	His-融合物表达	GST-融合物表达	纯化
ORF	PCR/克隆	His-融合物表达	GST-融合物表达	纯化	orf38	+	+	+	His-融合物
orf40	+	+	+	His-融合物	orf38	+	+	+	His-融合物
orf40	+	+	+	His-融合物	orf41	+	未测定	未测定
orf44	+	+	+	His-融合物	orf41	+	未测定	未测定
orf44	+	+	+	His-融合物	orf51	+	未测定	未测定
orf52	+	未测定	+	GST-融合物	orf51	+	未测定	未测定
orf52	+	未测定	+	GST-融合物	orf56	+	未测定	未测定
orf69	+	未测定	未测定		orf56	+	未测定	未测定
orf69	+	未测定	未测定		orf82	+	未测定	未测定
orf114	+	未测定	+	GST-融合物	orf82	+	未测定	未测定
orf114	+	未测定	+	GST-融合物	orf124	+	未测定	未测定

Claims

1.一种蛋白质，它包含选自SEQ ID 8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，40，42，44，46，48，50，52，54，56，58，60，62，64，66，68，70，72，74，76，78，80，82，84，86，88和90的氨基酸序列。

2.一种蛋白质，它与权利要求1所述的蛋白质有50％或更高的序列相同性。

3.一种蛋白质，它包含选自SEQ ID 8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，40，42，44，46，48，50，52，54，56，58，60，62，64，66，68，70，72，74，76，78，80，82，84，86，88和90的氨基酸序列的片段。

4.一种抗体，它与权利要求1至3任一项所述的蛋白质结合。

5.一种核酸分子，它编码权利要求1至3任一项所述的蛋白质。

6.根据权利要求5所述的核酸分子，它包含选自SEQ ID 7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87和89的核苷酸序列。

7.一种核酸分子，它包含选自SEQ ID 7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87和89的核苷酸序列的片段。

8.一种核酸分子，它包含与权利要求5至7任一项所述的核酸分子互补的核苷酸序列。

9.一种核酸分子，它包含的核苷酸序列与权利要求5至8任一项所述的核酸分子有50％或更高的序列相同性。

10.一种核酸分子，它在高度严谨条件下能与权利要求5至9任一项所述的核酸分子杂交。

11.一种组合物，它包含权利要求1至10任一项所述的蛋白质、核酸分子或抗体。

12.根据权利要求11所述的组合物，它是疫苗组合物或诊断组合物。

13.根据权利要求11或12所述的组合物，它用作药物。

14.权利要求11所述的组合物在生产用来治疗或预防由奈瑟氏球菌、尤其是脑膜炎奈瑟氏球菌引起的感染的药剂中的应用。