CN1597694A - 脑膜炎奈瑟氏球菌抗原 - Google Patents

脑膜炎奈瑟氏球菌抗原 Download PDF

Info

Publication number
CN1597694A
CN1597694A CNA2003101220871A CN200310122087A CN1597694A CN 1597694 A CN1597694 A CN 1597694A CN A2003101220871 A CNA2003101220871 A CN A2003101220871A CN 200310122087 A CN200310122087 A CN 200310122087A CN 1597694 A CN1597694 A CN 1597694A
Authority
CN
China
Prior art keywords
sequence
people
dna
gene
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2003101220871A
Other languages
English (en)
Inventor
V·马斯格阿尼
R·拉普奥利
M·皮扎
V·斯卡拉托
G·格兰迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chrion S P A
GSK Vaccines SRL
Original Assignee
Chrion S P A
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27269171&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1597694(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from GBGB9800760.2A external-priority patent/GB9800760D0/en
Priority claimed from GBGB9819015.0A external-priority patent/GB9819015D0/en
Priority claimed from GBGB9822143.5A external-priority patent/GB9822143D0/en
Application filed by Chrion S P A filed Critical Chrion S P A
Publication of CN1597694A publication Critical patent/CN1597694A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/22Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Neisseriaceae (F)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies

Abstract

本发明提供了脑膜炎奈瑟氏球菌(菌株A和B)的蛋白质,包括氨基酸序列、相应的核苷酸序列、表达数据和血清学数据。这些蛋白是用作疫苗、免疫原性组合物和/或诊断剂的有用的抗原。

Description

脑膜炎奈瑟氏球菌抗原
本申请是申请日为1999年1月14日、申请号为CN 99803873.3的中国专利申请的分案申请。
技术领域
本发明涉及脑膜炎奈瑟氏球菌细菌的抗原。
背景技术
脑膜炎奈瑟氏球菌(Neisseria meningitidis)是不能运动的人致病性革兰阴性双球菌。它群集在咽喉处,引起脑膜炎(有时没有脑膜炎而是败血病)。它与淋病奈瑟氏球菌(N.gonorrhoeae)密切相关,然而脑膜炎球菌与淋球菌明显不同的一个特征是所有病原性脑膜炎双球菌中都存在多糖荚膜。
脑膜炎奈瑟氏球菌会引起地方性和流行性疾病。在美国,其发病率为每年每100000人有0.6-1人,爆发时可以高得多(见Lieberman等人,(1996)″血清型A/C脑膜炎奈瑟氏球菌寡糖-蛋白偶联疫苗在幼儿中的安全性和免疫原性″,JAMA 275(19):1499-1503;Schuchat等人(1997)“1995年美国的细菌性脑膜炎”,N Engl J Med337(14):970-976)。在发展中国家,地方性疾病发病率要高得多,在流行时,发病率可高达每年每100000人有500起。该病的死亡率在美国很高,为10-20%,在发展中国家则要高得多。在引入了抗流感嗜血菌的偶联物疫苗后,脑膜炎奈瑟氏球菌是引起美国所有年龄人群中细菌性脑膜炎的主要原因(Schuchat等人(1997)同上)。
根据该生物的荚膜多糖,已经鉴定出12种脑膜炎奈瑟氏球菌的血清型。A型是亚撒哈拉-非洲地区流行病中最常见的病原体。B型和C型血清型菌是导致美国以及大多数发达国家内的大多数病例的原因。W135和Y型血清型菌是导致美国和发达国家的其余病例的原因。目前使用的脑膜炎球菌疫苗是由血清型A、C、Y和W135组成的四价多糖疫苗。尽管其在青少年和成人中有效,但是它诱导了差的免疫应答和短期的保护作用,并且不能用于婴儿[例如,见发病率和死亡率每周报道,46卷,PR-5(1997)]。这是因为多糖是T细胞非依赖型抗原,其诱导的弱免疫应答不能通过重复免疫来加强。在流感嗜血杆菌的疫苗接种成功后,已经开发出了针对血清型A和C的偶联疫苗,现在是临床测试的最终阶段(Zollinger WD″新的和改进的抗脑膜炎球菌疾病疫苗″,在:New Generation Vaccines中,同上,469-488页;Lieberman等人(1996)同上;Costantino等人(1992)“抗脑膜炎球菌A和C偶联疫苗的开发和I期临床测试”,Vaccine,10:691-698)。
然而,脑膜炎球菌B仍是一个问题。此血清型目前在美国、欧洲和南美州引起的病例约占总脑膜炎的50%。不能采用多糖方法,因为menB荚膜多糖是α(2-8)-相连的N-乙酰基神经氨酸的聚合物,它也存在于哺乳动物组织中。这导致了对该抗原的耐受;实际上,如果引发免疫应答,则该免疫应答是抗自身的,因此是不希望的。为了避免引起自身免疫力并诱导保护性免疫应答,已经对该荚膜多糖进行化学修饰,例如用N-丙酰基代替N-乙酰基,而不改变特异性抗原性(Romero和Outschoorn(1994)″B型脑膜炎球菌候选疫苗的目前状况:荚膜或非荚膜?″ClinMicrobiol Rev 7(4):559-575)。
menB疫苗的另一种方法采用外膜蛋白(OMP)的复合物混合物,它只含有OMP、或富集在膜孔蛋白中的OMP,或缺失4型OMP(认为它诱导了封闭杀菌活性的抗体)。该方法产生的疫苗的性质还未经完全分析。它们能保护机体抵抗同源的菌株,但是当有许多外膜蛋白的抗原性变株时一般无效。为了克服抗原性差异,已经构建了含有多达9种不同膜孔蛋白的多价疫苗(例如,Poolman JT(1992)“脑膜炎球菌疫苗的发展”Infect.Agents Dis.4:13-28)。用于外膜疫苗的其它蛋白是opa和opc蛋白,但是这些方法均不能克服抗原性差异(例如Ala′Aldeen和Borriello(1996)″脑膜炎球菌运铁蛋白结合蛋白1和2均是外露的,并产生能杀伤同源和异源菌株的杀菌性抗体″Vaccine14(1):49-53)。
已可得到脑膜炎球菌和淋球菌基因和蛋白的一定数量的序列信息(例如EP-A-0467714,WO96/29412),但这决不完全的。提供进一步的序列信息,就有机会能鉴定出估计是免疫系统靶标且没有抗原性差异的分泌的或外露的蛋白。例如,一些已鉴定的蛋白可作为抗脑膜炎球菌B有效疫苗的成分,一些可作为抗有所脑膜炎球菌血清型疫苗的成分,其它可作为抗所有病原性奈瑟氏球菌疫苗的成分。
发明内容
本发明提供了一些蛋白,这些蛋白含有公开在实施例中的脑膜炎奈瑟氏球菌氨基酸序列。
本发明还提供了含有与实施例所公开的脑膜炎奈瑟氏球菌氨基酸序列同源(即具有序列相同性)的序列的蛋白。根据具体的序列,序列相同性的程度宜大于50%(例如60%、70%、80%、90%、95%、99%或更高)。这些同源性蛋白包括实施例中公开的序列的突变体和等位基因变体。通常,认为两种蛋白之间有50%或更高的相同性表明功能等价。蛋白之间的相同性宜用在MPSRCH程序(Oxford Molecular)中执行的Smith-Watemen同源性搜寻算法来确定,采用仿射(affine)空隙搜寻,参数“空隙开口罚分(gap open penalty)”为12,“空隙延伸罚分(gap extension penalty)”为1。
本发明还提供了包含实施例所公开的脑膜炎奈瑟氏球菌氨基酸序列片段的蛋白。该片段应包含该序列中至少n个连续的氨基酸,根据具体的序列,n为7或更高(例如,8、10、12、14、16、18、20或更高)。该片段宜包含该序列的一个表位。
本发明的蛋白当然可用各种方法(例如重组表达、从细胞培养中纯化、化学合成等)制成各种形式(例如天然的、融合物等)。它们宜制成基本上纯的形式(即基本上不含其它脑膜炎奈瑟氏球菌或宿主细胞蛋白)。
另一方面,本发明提供了结合这些蛋白的抗体。它们可能是多克隆的或单克隆的,可用任何合适的方法制得。
还有一方面,本发明提供了包含实施例所公开的脑膜炎奈瑟氏球菌核苷酸序列的核酸。另外,本发明还提供了包含与实施例所公开的脑膜炎奈瑟氏球菌核苷酸序列同源(即具有序列相同性)的序列的核酸。
另外,本发明还提供了能与实施例中公开的脑膜炎奈瑟氏球菌核酸杂交(较佳的是在“高度严谨”条件(例如65℃,在0.1×SSC、0.5%SDS溶液中)下杂交)的核酸。
本发明还提供了包含这些序列之片段的核酸。这些核酸应包含来自脑膜炎奈瑟氏球菌序列的至少n个连续的核苷酸,根据具体的序列,n为10或更高(例如,12、14、15、18、20、25、30、35、40或更高)。
还有一方面,本发明提供了编码本发明的蛋白和蛋白片段的核酸。
也应理解,本发明提供了包含与上述那些序列互补的序列的核酸(例如用于反义或探针目的)。
当然,本发明的核酸可用各种方式(例如化学合成,从基因组或cDNA文库、或从生物体本身制得等)制得,并可采用各种形式(例如单链、双链、载体、探针等)。
另外,术语“核酸”包括DNA和RNA,以及它们的类似物,如含有修饰的骨架的那些,还包括肽核酸(PNA)等。
另一方面,本发明提供了含有本发明的核苷酸序列的载体(如表达载体)以及转化了这些载体的宿主细胞。
另一方面,本发明提供了包含本发明的蛋白、抗体和/核酸的组合物。例如,这些组合物适合用作疫苗,或作为诊断性试剂,或作为免疫原性组合物。
本发明还提供了本发明的核酸、蛋白或抗体用作药剂(例如作为疫苗)或作为诊断性试剂的应用。本发明还提供了本发明的核酸、蛋白或抗体在生产下列物质中的应用:(i)用于治疗或预防奈瑟氏球菌感染的药剂;(ii)用于检测奈瑟氏球菌或针对奈瑟氏球菌产生的抗体是否存在的诊断性试剂;和/或(iii)可产生针对奈瑟氏球菌的抗体的制剂。所述奈瑟氏球菌可以是任何种或菌株(例如淋病奈瑟氏球菌),但较佳的是脑膜炎奈瑟氏球菌,尤其是菌株A、菌株B或菌株C。
本发明还提供了一种治疗患者的方法,该方法包括给予患者治疗有效量的本发明的核酸、蛋白和/或抗体。
还有一方面,本发明提供了以下各种方法。
本发明提供了一种生产本发明蛋白的方法,该方法包括在诱导蛋白表达的条件下培育本发明的宿主细胞的步骤。
本发明提供了一种生产本发明的蛋白或核酸的方法,其中用化学手段合成部分或全部的蛋白或核酸。
本发明提供了一种检测本发明的多核苷酸的方法,该方法包括下列步骤:(a)在杂交条件下使本发明的核酸探针与生物样品接触,形成双链体;和(b)检测所述双链体。
本发明提供了一种检测本发明的蛋白质的方法,该方法包括下列步骤:(a)在适合形成抗体-抗原复合物的条件下使本发明的抗体和生物样品接触;和(b)检测所述复合物。
与PCT/IB98/01665中公开的序列不同,认为本申请中公开的序列在淋病奈瑟氏球菌中没有任何明显的同源性。因此,本发明的序列还可用来制备区分脑膜炎奈瑟氏球菌和淋病奈瑟氏球菌的制剂。
下面归纳了为了实施本发明而采用的标准技术和方法(例如用公开的序列接种或诊断性目的)。这种归纳不是对本发明的限制,而是举例,这些例子可以采用,但是不要求一定用。
总论
除非另有描述,本发明的实施将采用分子生物学、微生物学、重组DNA和免疫学的常规技术,这些均是本领域技术人员所知的。这些技术在下列文献中有完整的描述:例如,Sambrook《分子克隆实验手册》第2版(1989);《DNA克隆》第I和II卷(D.N.Glover编辑1985);《寡核苷酸合成》(M.J.Gait编辑,1984);《核酸杂交》(B.D.Hames和S.J.Higgins编辑.1984);《转录和翻译》(B.D.Hames和S.J.Higgins编辑,1984);《动物细胞培养》(R.I.Freshney编辑,1986);《固定化细胞和酶》(IRL出版社,1986);B.Perbal,《分子克隆实用指南》(1984);《酶学方法》系列丛书(Academic Press,Inc.),尤其是154和155卷;《哺乳动物细胞用的基因转移载体》(J.H.Miller和M.P.Calos编辑,1987,Cold Spring Harbor Laboratory);Mayer和Walker编辑(1987),《细胞和分子生物学的免疫化学方法》(Academic Press,London);Scopes,(1987)《蛋白质纯化:原理和实践》第2版(Springer-Verlag,N.Y.),以及《实验免疫学手册》I-IV卷(D.M.Weir和C.C.Blackwell编辑1986)。
在本说明书中采用了核苷酸和氨基酸的标准缩写。
本文引用的所有出版物、专利和专利申请均纳入本文作参考。尤其是将英国专利申请9800760.2、9819015.0和9822143.5的内容纳入本文作为参考。
定义
当组合物中总X+Y重量的至少85%是X时,则称含有X的组合物“基本上没有Y”。较佳的,X占组合物中X+Y总重量的至少约90%,更佳至少约95%或者甚至99%(重量)。
术语“包含”指“包括”以及“由…组成”,例如组合物“包含”X可以是只由X组成,或可包括X以外的物质,例如X+Y。
术语“异源”指在自然界中发现不在一起的两种生物学组分。此组分可以是宿主细胞、基因、或调控区如启动子。尽管异源组分在自然界中发现不在一起,但是它们能一起起作用,例如当与基因异源的启动子与该基因操作性相连时。另一个例子是奈瑟氏球菌序列与小鼠宿主细胞异源。还有一个例子是相同或不同蛋白的两个表位以自然界中未曾发现的排列方式装配到一个蛋白中。
“复制起点”是启动和调节多核苷酸(例如表达载体)复制的多核苷酸序列。复制起点可作为细胞内多核苷酸复制的自主性单位,能在其自身的控制下进行复制。复制起点是载体在特定宿主细胞中复制所需的。有了某一复制起点,表达载体就能在细胞中合适蛋白的存在下高拷贝数的复制。复制起点的例子是在酵母中有效的自主复制序列;以及在COS-7细胞中有效的病毒性T-抗原。
“突变体”序列定义成与天然或公开的序列不同但具有序列相同性的DNA、RNA或氨基酸序列。根据具体的序列,天然或公开的序列与突变体序列之间的序列相同性程度宜大于50%(例如60%、70%、80%、90%、95%、99%或更高,用上述Smith-Waterman算法计算出)。如本文所述,本文提供的核酸序列的核酸分子或区域的“等位基因变体”是在另一或第二个分离物基因组中基本相同的基因座上的核酸分子或区域,由于诸如突变或重组引起的自然变异,它们具有相似但不相同的核酸序列。编码区等位基因变体通常编码的蛋白具有与其比较的基因所编码蛋白相似的活性。等位基因变体还可包含基因5′或3′非翻译区中的变化,例如在调控控制区中的变化(例如见美国专利5,753,235)。
表达系统
奈瑟氏球菌核苷酸序列可在各种不同的表达系统中表达;例如和哺乳动物细胞、杆状病毒、植物、细菌和酵母一起使用的那些系统。
i.哺乳动物系统
哺乳动物表达系统是本领域中已知的。哺乳动物启动子是能结合哺乳动物RNA聚合酶并启动下游(3′)编码序列(如结构基因)转录成mRNA的任何DNA序列。启动子具有一个转录起始区,其通常邻近编码序列的5′端,还具有一个TATA盒,其通常位于转录起始位点上游25-30个碱基对(bp)处。认为TATA盒指导RNA聚合酶II在正确位点开始RNA合成。哺乳动物启动子还含有一个上游启动子元件,其通常位于TATA盒上游100至200bp内。该上游启动子元件决定了转录启动的速度,并可在两个方向之一上起作用[Sambrook等人(1989)“克隆基因在哺乳动物细胞中的表达”《分子克隆实验手册》,第2版]。
哺乳动物病毒基因通常是高表达的,具有宽的宿主范围;因此,编码哺乳动物病毒基因的序列提供了特别有用的启动子序列。例子包括SV40早期启动子、小鼠乳房肿瘤病毒LTR启动子、腺病毒主要晚期启动子(Ad MLP)以及单纯疱疹病毒启动子。另外,从非病毒基因(如小鼠金属硫蛋白基因)衍生的序列也提供了有用的启动子序列。表达可以是组成型的或受调控的(诱导的),这取决于该启动子能否在激素反应性细胞中用促糖皮质激素诱导。
增强元件(增强子)的存在,联合上述启动子元件通常会提高表达水平。增强子是这样一种调控性DNA序列,当其与同源或异源启动子相连,合成在正常的RNA起始位点开始时,它能刺激转录提高1000倍。当增强子位于转录起始位点的上游或下游,处于正常或翻转方向,或距离启动子1000个核苷酸以上的距离时,它均具有活性[Maniatis等人(1987)Science 236:1237;Alberts等人(1989)《细胞分子生物学》,第2版]。从病毒衍生获得的增强子元件可能是特别有用的,因为它们通常具有较宽的宿主范围。例子包括SV40早期基因增强子[Dijkema等人(1985)EMBO J.4:761]以及衍生自Rous肉瘤病毒的长末端重复序列(LTR)的增强子/启动子[Gorman等人(1982b)Proc.Natl.Acad.Sci.79:6777]以及来自人巨细胞病毒的增强子/启动子[Boshart等人(1985)Cell 41:521]。另外,一些增强子仅仅在诱导物(例如激素或金属离子)的存在下是可调节的并变成具有活性[Sassone-Corsi和Borelli(1986)Trends Genet.2:215;Maniatis等人(1987)Science 236:1237]。
DNA分子可在哺乳动物细胞中胞内表达。启动子序列可以和DNA分子直接相连,在这种情况下,重组蛋白的N端第一个氨基酸始终是甲硫氨酸,其由ATG起始密码子编码。如果需要,可通过和溴化氰体外培育来从蛋白上切下该N端。
另外,外来蛋白也可从细胞中分泌到生长培养基中,方法是产生嵌合的DNA分子,该DNA分子编码的融合蛋白包括一前导序列片段,该片段在哺乳动物细胞中提供了外源蛋白的分泌。较佳的,在前导序列片段和外源基因之间可以有能在体内或体外断裂的加工位点。前导序列片段通常编码一种信号肽,该信号肽由指导蛋白分泌出细胞的疏水性氨基酸组成。腺病毒三联前导序列是在哺乳动物细胞中提供分泌外来蛋白的一个前导序列例子。
通常,哺乳动物细胞识别的转录终止和聚腺苷酸化序列是位于翻译终止密码子3′的调控区域,因此它和启动子元件一起连接在编码序列的侧面。成熟mRNA的3′端由定点的转录后断裂和聚腺苷酸化形成[Bimstiel等人(1985)Cell 41:349;Proudfoot和Whitelaw(1988)″真核RNA的终止和3′端加工″《转录和剪接》(B.D.Hames和D.M.Glover编辑);Proudfoot(1989)Trends Biochem.Sci.14:105]。这些序列指导mRNA的转录,mRNA能被翻译成该DNA编码的多肽。转录终止子/聚腺苷酸化信号的例子包括从SV40衍生获得的那些[Sambrook等人(1989)“克隆基因在培养的哺乳动物细胞中的表达”《分子克隆实验手册》]。
通常,上述组件,包括启动子、聚腺苷酸化信号以及转录终止序列被一起放在表达构建物中。如果需要,该表达构建物中还包括增强子、具有功能性剪接供体和受体位点的内含子以及前导序列。表达构建物通常以复制子形式维持,例如是能在宿主(如哺乳动物细胞或细菌)中稳定维持的染色体外元件(如质粒)。哺乳动物复制系统包括从动物病毒衍生的那些系统,其需要反式作用因子来进行复制。例如,含有乳多空病毒复制系统的质粒,如SV40[Gluzman(1981)Cell 23:175]或多瘤病毒,在合适的病毒T抗原存在下复制出极高的拷贝数。哺乳动物复制子的其它例子包括衍生自牛乳头瘤病毒和EB病毒的复制子。另外,复制子可以有两个复制系统,从而使其能维持在例如哺乳动物细胞中进行表达并能在原核宿主中克隆和扩增。这些哺乳动物细菌穿梭载体的例子包括pMT2[Kaufman等人(1989)Mol.Cell.Biol.9:946]和pHEBO[Shimizu等人(1986)Mol.Cell.Biol.6:1074]。
所用的转化程序取决于待转化的宿主。将异源多核苷酸导入哺乳动物细胞中的方法是本领域所知的,包括葡聚糖介导的转染、磷酸钙沉淀、Polybrene(1,5-二甲基-1,5-二氮十一亚甲基聚甲溴化物)介导的转染、原生质体融合、电穿孔、将多核苷酸包裹在脂质体中以及将DNA直接显微注射到胞核中。
可作为宿主进行表达的哺乳动物细胞系是本领域中已知的,包括许多从美国典型培养物保藏中心(ATCC)获得的无限增殖细胞系,包括但不局限于,中国仓鼠卵巢(CHO)细胞、海拉细胞、幼仓鼠肾(BHK)细胞、猴肾细胞(COS)、人肝细胞癌细胞(如Hep G2)和其它许多细胞系。
ii.杆状病毒系统
编码蛋白质的多核苷酸也可插入合适的昆虫表达载体中,并与该载体中的控制元件操作性相连。载体构建采用本领域已知的技术。总地来说,表达系统的组分包括一个转移载体,通常是细菌质粒,其含有杆状病毒基因组片段以及便于插入待表达异源基因的限制性位点;野生型杆状病毒,其序列与转移载体中的杆状病毒特异性片段同源(这使得异源基因能同源重组到杆状病毒基因组中);以及合适的昆虫宿主细胞和生长培养基。
在将编码蛋白质的DNA序列插入转移载体中后,将载体和野生型病毒基因组转染到昆虫宿主细胞中,使载体和病毒基因组重组。表达包装的重组病毒,鉴定并纯化重组噬斑。用于杆状病毒/昆虫细胞表达系统的材料及其方法,除别的以外,可以试剂盒形式购自Invitrogen,San Diego CA(″MaxBac″试剂盒)。这些技术通常是本领域技术人员所知的,在Summers和Smith的Texas Agricultural Experiment Station Bulletin No.1555(1987)(后称“Summer和Smith的文章”)中有充分描述。
在将编码蛋白质的DNA序列插入杆状病毒基因组之前,通常将上述组件,包括启动子、前导序列(如果需要)、感兴趣的编码序列以及转录终止序列装配在中间置换型构建物(转移载体)中。该构建物可含有单个基因以及操作性相连的调控元件;多个基因,每个基因有其自己的操作性相连调控元件;或是由同一组调控元件调控的多个基因。中间置换型构建物通常保持在一个复制子中,例如能在宿主(如细菌)内稳定保持的染色体外元件(如质粒)。复制子将具有一个复制系统,从而使其能保持在合适的宿主中进行克隆和扩增。
目前,用来将外源基因导入AcNPV的最常用的转移载体是pAc373。还可设计本领域技术人员已知的其它许多载体。这些载体例如包括,pVL985(其将多角体蛋白的起始密码子从ATG变为ATT,在ATT下游32个碱基对处引入一个BamHI克隆位点;见Luckow和Summers,Virology(1989)17:31。
质粒通常还含有多角体蛋白聚腺苷酸化信号(Miller等人(1988)Ann.Rev.Microbiol.,42:177)以及用来在大肠杆菌中选择和繁殖的原核氨苄青霉素抗性(amp)基因和复制起点。
杆状病毒转移载体通常含有杆状病毒启动子。杆状病毒启动子是能结合杆状病毒RNA聚合酶并启动下游(5′到3′)编码序列(如结构基因)转录成mRNA的DNA序列。启动子具有一个转录起始区,该区通常邻近编码序列的5′端。该转录起始区通常包括一个RNA聚合酶结合位点以及一个转录起始位点。杆状病毒转移载体还可能有称为增强子的第二个区,如果该区域存在,它通常在结构基因的远端。表达可以是调控的或组成型的。
在病毒感染周期晚期大量转录的结构基因提供特别有用的启动子序列。例子包括从编码病毒多角体蛋白的基因衍生获得的序列,Friesen等人(1986)“杆状病毒基因表达的调控”《杆状病毒分子生物学》(Walter Doerfler编辑);EPO公开号127 839和155476;以及编码p10蛋白的基因,Vlak等人(1988),J.Gen.Virol.69:765。
编码合适的信号序列的DNA可以衍生自分泌的昆虫或杆状病毒蛋白的基因(如杆状病毒多角体蛋白基因)(Carbonell等人,(1988)Gene,73:409)。另外,由于哺乳动物细胞翻译后修饰(如信号肽断裂、蛋白水解断裂和磷酸化)的信号看来可被昆虫细胞识别,且分泌和胞核积累所需的信号看来在非脊椎动物细胞和脊椎动物细胞之间是保守的,因此也可用非昆虫来源的前导序列来提供昆虫中的分泌,这些前导序列例如是从编码人α-干扰素(Maeda等人(1985),Nature 315:592)、人胃泌素释放肽(Lebacq-Verheyden等人(1988),Molec.Cell.Biol.8:3129)、人IL-2(Smith等人(1985)PNAS,82:8404)、小鼠IL-3(Miyajima等人(1987)Gene 58:273)和人葡糖脑苷脂酶(Martin等人(1988)DNA,7:99)的基因衍生获得的。
重组多肽或聚蛋白可以在胞内表达,或如果它和合适的调控序列一起表达,它可被分泌。非融合的外源蛋白的良好的胞内表达通常要求具有短前导序列的异源基因在ATG起始信号前含有合适的翻译起始信号。如果需要,可通过和溴化氰体外培育来从成熟蛋白上切下N端甲硫氨酸。
另外,可通过产生嵌合的DNA分子将非天然分泌的重组聚蛋白或蛋白从昆虫细胞中分泌出来,该嵌合的DNA分子所编码的融合蛋白包含一前导序列片段,该片段提供了外源蛋白在昆虫中的分泌作用。该前导序列片段通常编码一种信号肽,该信号肽包含的疏水性氨基酸指导蛋白质转移到内质网中。
在插入了编码该蛋白表达产物前体的DNA序列和/或基因后,用转移载体的异源DNA和野生型杆状病毒的基因组DNA共同转化(通常是共转染)昆虫细胞宿主。构建物的启动子和转录终止序列通常包含2-5kb的杆状病毒基因组片段。将异源DNA引入杆状病毒中所需位点内的方法是本领域所知的。(见Summers和Smith的文章,同上;Ju等人(1987);Smith等人,Mol.Cell.Biol.(1983)3:2156;和Luckow和Summers(1989))。例如,插入可以是通过同源双交换重组来插入基因如多角体蛋白基因中;插入还可以是插入工程改造入所需杆状病毒基因内的限制性酶切位点中。Miller等人(1989),Bioessays 4:91。当DNA序列被克隆在表达载体多角体蛋白基因位置中时,其5′和3′均侧接了多角体蛋白特异性序列,并位于多角体蛋白启动子的下游。
随后将新形成的杆状病毒表达载体包装到感染性重组杆状病毒中。发生同源重组的频率很低(在约1%和5%之间);因此,共转染后产生的大多数病毒仍是野生型病毒。故需要一种方法来鉴别重组病毒。该表达系统的一个优点是目视筛选能区分重组病毒。在病毒感染后期,天然病毒产生的多角体蛋白在受感染细胞胞核中水平非常高。累积的多角体蛋白形成的包涵体还含有包埋颗粒。这些包涵体的大小高达15微米,它们具有高度的折光性,从而使它们呈现明亮发光的外观,在光学显微镜下很容易观察到。感染了重组病毒的细胞缺少包涵体。为了区分重组病毒和野生型病毒,用本领域已知的技术将转染上清接种到单层昆虫细胞上形成噬斑。即,在光学显微镜下筛选存在(表明是野生型病毒)或不存在(表明是重组病毒)包涵体的噬斑。“当代微生物学方法”第2卷(Ausubel等人编辑),16.8(增补10,1990);Summers和Smith,同上;Miller等人(1989)。
已经开发出能感染进入几种昆虫细胞的重组杆状病毒表达载体。例如,已经开发出用于感染以下昆虫细胞的重组杆状病毒:埃及伊蚊、苜蓿丫纹夜蛾、家蚕、黑尾果蝇、草地夜蛾和粉纹夜蛾(WO 89/046699;Carbonell等人(1985)J.Virol.56:153;Wright(1986)Nature 321:718;Smith等人(1983)Mol.Cell.Biol.3:2156;综述见Fraser等人(1989)Vitro Cell.Dev.Biol.25:225)。
可以购得细胞和细胞培养基用于在杆状病毒/表达系统中直接表达和融合表达异源多肽;细胞培养技术是本领域技术人员通常所知的。例如见Summers和Smith,同上。
然后,经修饰的昆虫细胞可以生长在合适的营养培养基中,该培养基能稳定地保持质粒存在于修饰的昆虫宿主中。当表达产物基因处于可诱导的控制下时,可以使宿主生长至高密度,并诱导表达。另外,当表达是组成型表达时,产物将被连续表达进入培养基中,营养性培养基必需不断循环,同时取出感兴趣的产物并补充消耗的营养物。产物可用以下技术来纯化:例如层析,如HPLC、亲和层析、离子交换层析等;电泳;密度梯度离心;溶剂抽提等。产物可按需作进一步纯化,以基本上除去所有也分泌到培养基中或由昆虫细胞裂解而产生的昆虫蛋白,以提供一种至少基本上不含宿主碎片(如蛋白质、脂质和多糖)的产物。
为了获得蛋白质表达,将从转化子衍生获得的重组宿主细胞培育在允许重组蛋白编码序列表达的条件下。这些条件将随所选定的宿主细胞而变。然而,本领域技术人员容易根据本领域已知的知识来确定该条件。
iii.植物系统
本领域中已知有许多植物细胞培养系统和全植物基因表达系统。典型的植物细胞基因表达系统包括在以下专利中描述的那些,例如:US 5,693,506;US 5,659,122;和US5,608,143。Zenk,Phytochemistry 30:3861-3863(1991)中描述了在植物细胞培养物中遗传表达的其它例子。除上述参考文献外,关于植物蛋白信号肽的描述还可在下列文献中找到:Vaulcombe等人,Mol.Gen.Genet.209:33-40(1987);Chandler等人,PlantMolecular Biology 3:407-418(1984);Rogers,J.Biol.Chem.260:3731-3738(1985);Rothstein等人,Gene 55:353-356(1987);Whittier等人,Nucleic Acids Research15:2515-2535(1987);Wirsel等人,Molecular Microbiology 3:3-14(1989);Yu等人,Gene 122:247-253(1992)。关于用植物激素、赤霉素酸和赤霉素酸诱导分泌的酶调节植物基因表达的描述可在R.L.Jones和J.MacMillin,Gibberellins,《植物生理学进展》,Malcolm B.Wilkins编辑,1984 Pitman Publishing Limited,London,21-52页中找到。描述其它调节代谢的基因的参考文献参见:Sheen,Plant Cell,2:1027-1038(1990);Maas等人,EMBO J.9:3447-3452(1990);Benkel和Hickey,Proc.Natl.Acad.Sci.84:1337-1339(1987)。
通常,利用本领域已知的技术,将所需的多核苷酸序列插入一表达盒中,该表达盒含有为在植物中操作而设计的基因调控元件。将该表达盒插入所需的表达载体中,表达盒的上游和下游有适合在植物宿主中表达的伴随序列。这些伴随序列可来自质粒或病毒,并为载体提供所需的性质,以允许载体将DNA从起初的克隆宿主(如细菌)中移动到所需植物宿主中。基础的细菌/植物载体构建物最好能提供宽的宿主范围原核复制起点;原核可选择标记;以及,对于农杆菌转化而言,宜提供T DNA序列用于农杆菌介导转移至植物染色体。当异源基因不易检测时,该构建物最好还具有一个适用于确定植物细胞是否已被转化的可选择标记基因。关于合适标记(例如对于禾草类家族成员)的综述可在Wilmink和Dons,1993,PlantMol.Biol.Reptr,11(2):165-185中找到。
还建议采用适合将异源序列整合到植物基因组中的序列。这些序列可能包括用于同源重组的转座子序列以及允许将异源表达盒随机插入植物基因组中的Ti序列。合适的原核可选择标记包括抗生素(如氨苄青霉素或四环素)抗性标记。编码其它功能的其它DNA序列也可存在于载体中,这是本领域所知的。
本发明的核酸分子可包括在一个表达盒中来表达感兴趣的蛋白质。通常只有一个表达盒,但是两个或多个表达盒也是可行的。除了编码异源蛋白的序列外,重组表达盒还含有下列元件:启动子区域、植物5′非翻译序列、起始密码子(根据结构基因原来是否具有而定)、以及转录和翻译终止序列。表达盒5′和3′端的独特限制性酶位点能使表达盒方便地插入预先存在的载体中。
异源编码序列可以是任何与本发明有关的蛋白的编码序列。编码感兴趣的蛋白的序列将编码出一个信号肽,该信号肽能适当地加工和转运蛋白质,并且通常缺少可能会导致本发明的所需蛋白与膜结合的序列。由于对于大部分来说,转录起始区将是发芽期间被表达和转运的基因的转录起始区,通过采用提供转运的信号肽,也可提供对感兴趣蛋白质的转运。通过这种方式,感兴趣的蛋白将从表达该蛋白的细胞中转运出来,并能被有效地收获。通常,种子中的分泌是通过糊粉或小盾体上皮层进入种子的胚乳。尽管不需要使蛋白从产生该蛋白的细胞中分泌出来,但是这种分泌有利于重组蛋白的分离和纯化。
由于所需基因产物的最终表达将在真核细胞中进行,因此需要确定克隆的基因部分是否含有作为内含子被宿主剪接体机制加工的序列。如果是这样,需要对“内含子”区进行定点诱变,以防止一部分遗传信息作为错误的内含子密码而丧失,Reed和Maniatis,Cell 41:95-105,1985。
可用微量移液管以机械方式转移重组DNA,将载体直接显微注射到植物细胞中。Crossway,Mol.Gen.Genet,202:179-185。还可用聚乙二醇将遗传物质转移到植物细胞中,Kens等人,Nature,296,72-74,1982。导入核酸片段的另一种方法是用小颗粒进行高速弹道贯穿,在这些小珠或颗粒的基质中或表面上带有核酸,Klein等人,Nature,327,70-73,1987,Knudsen和Muller,1991,Planta,185:330-336提出用颗粒轰击大麦胚乳以产生转基因大麦。还有一种导入方法是使原生质体和其它实体(微细胞(minicell)、细胞、溶酶体或其它可融合的脂质表面体)融合,Fraley等人,Proc.Natl.Acad.Sci.USA,79,1859-1863,1982。
载体也可通过电穿孔导入植物细胞中。(Fromm等人,PNAS 82:5824,1958)。在该技术中,在含有基因构建物的质粒存在下对植物原生质体进行电穿孔。高电场强度的电脉冲使生物膜可逆地被通透,从而允许导入质粒。电穿孔的植物原生质体改造了细胞壁,分裂并形成植物胼胝体。
本发明可转化所有的植物,从中能分离出原生质体并能培育产生全再生植株,从而回收得到含有转基因的全植株。已经知道实际上所有植物均可以从培育的细胞或组织再生,它们包括但不局限于,甘蔗、甜菜、棉花、果实和其它树、豆科植物和蔬菜的所有主要种类。一些合适的植物包括,例如,草莓属、莲花属、苜蓿属、驴食豆属、三叶草属、胡卢巴属、豇豆属、柑橘属、亚麻属、老鹳草属、Manihot、Daucus、鼠耳芥属、芸苔属、萝卜属、白芥属、颠茄属、辣椒属、曼陀罗属、天仙子属、番茄属、烟草属、茄属、碧冬茄属、毛地黄属、Majorana、菊苣属、向日葵属、莴苣属、雀麦属、天门冬属、金鱼草属、龙骨角属、Nemesia、天竺葵属、稷属、狼尾草属、毛茛属、千里光属、Salpiglossis、香瓜属、Browaalia、大豆属、黑麦草属、玉蜀黍属、小麦、蜀黍属和曼陀罗属各种类。
各种植物的再生方式是不同的,但通常是首先提供含有异源基因拷贝的转化的原生质体悬液。形成胼胝体组织,从胼胝体中诱生出枝条,随后是根。另外,从原生质体悬液可以诱生形成胚胎。这些胚胎象天然的胚胎那样发芽形成植物。培养基通常含有各种氨基酸和激素,如植物生长素和细胞分裂素。尤其是对于玉米和苜蓿属来说,在培养基中加入谷氨酸和脯氨酸也是很有利的。枝条和根通常同时发育。有效的再生取决于培养基、基因型以及培养史。如果控制了这三个变量,那么再生能完全再现和重复。
在一些植物细胞培养系统中,本发明所需的蛋白可能被排泄出来,或者蛋白可从全植物中提取出来。当本发明所需的蛋白被分泌到培养基中后,就可进行收集。或者,可以用机械方式破碎胚以及无胚-半种子或其它植物组织,以释放出分泌到细胞和组织之间的蛋白。将该混合物悬于缓冲液中,以提取可溶性蛋白。然后用常规的蛋白分离和纯化方法纯化重组蛋白。用常规方法调节时间、温度、pH、氧和体积等参数,以优化异源蛋白的表达和回收。
iv.细菌系统
细菌表达技术是本领域已知的。细菌启动子是能结合细菌RNA聚合酶并启动下游(3′)编码序列(如结构基因)转录成mRNA的DNA序列。启动子具有一个转录起始区,其通常位于编码序列的5′端附近。该转录起始区通常包括一个RNA聚合酶结合位点以及一个转录起始位点。细菌启动子可能还有第二个功能区域称为操纵子,它可能与毗邻的RNA合成开始的RNA聚合酶结合位点重叠。该操纵子允许(可诱导)对转录的负调节,因为基因阻遏蛋白可能结合操纵子并因而抑制特定基因的转录。在负调节元件(如操纵子)不存在时,可能发生组成型表达。另外,正调节可通过基因激活蛋白结合序列来实现,如果有的话,它通常邻近RNA聚合酶结合序列(5′)。基因激活蛋白的例子是分解代谢物激活剂蛋白(CAP),它帮助启动大肠杆菌(E.coli)中的lac操纵子的转录[Raibaud等人(1984)Annu.Rev.Genet.18:173]。因此,表达调控可能是正作用或负作用,从而增强或减弱了转录。
编码代谢途径中的酶的序列提供了特别有用的启动子序列。例子包括衍生自糖(如半乳糖、乳糖(lac)[Chang等人(1977)Nature 198:1056]和麦芽糖)代谢酶的启动子序列。其它例子包括衍生自生物合成酶(如色氨酸(trp))[Goeddel等人(1980)Nuc.AcidsRes.8:4057;Yelverton等人(1981)Nucl.Acids Res.9:731;美国专利4,738,921;EP-A-0036776和EP-A-0121775]的启动子序列。g-内酰胺酶(bla)启动子系统[Weissmann(1981)″干扰素的克隆和其它错误″《干扰素3》(I.Gresser编辑)],λ嗜菌体PL[Shimatake等人(1981)Nature 292:128]和T5[美国专利4,689,406]启动子系统也提供了有用的启动子序列。
另外,非天然存在的合成的启动子也可象细菌启动子一样起作用。例如,一种细菌或嗜菌体启动子的转录激活序列可以和另一种细菌或嗜菌体启动子的操纵子序列连接在一起,形成合成的杂合启动子[美国专利4,551,433]。例如,tac启动子是杂合的trp-lac启动子,它由trp启动子以及受lac阻遏蛋白调节的lac操纵子序列组成[Amann等人(1983)Gene 25:167;de Boer等人,(1983)Proc.Natl.Acad.Sci.80:21]。另外,细菌启动子可包括非细菌来源但能结合细菌RNA聚合酶并启动转录的天然存在的启动子。天然存在的非细菌来源的启动子还能和相容的RNA聚合酶偶联在一起,从而在原核细胞中高水平地表达某些基因。噬菌体T7 RNA聚合酶/启动子系统是偶联的启动子系统的一个例子[Studier等人(1986)J.Mol.Biol.189:113;Tabor等人(1985)Proc.Natl.Acad.Sci.82:1074]。另外,杂合的启动子还可由嗜菌体启动子以及大肠杆菌操纵子区域组成(EPO A-0 267 851)。
除了有功能的启动子序列外,有效的核糖体结合位点对于外来基因在原核细胞中的表达也是有用的。在大肠杆菌中,核糖体结合位点称为Shine-Dalgamo(SD)序列,其包括起始密码子(ATG)以及在起始密码子上游3-11个核苷酸处的长度为3-9个核苷酸的序列[Shine等人(1975)Nature 254:34]。认为SD序列是通过SD序列和大肠杆菌16S rRNA的3′端碱基配对来促进mRNA与核糖体结合的[Steitz等人(1979)″信使RNA中的遗传信号和核苷酸序列″《生物学调节和发育:基因表达》(编者R.F.Goldberger)]。为了表达具有弱的核糖体结合位点的原核基因和真核基因[Sambrook等人(1989)″克隆基因在大肠杆菌中的表达″《分子克隆实验手册》]。
DNA分子可以在胞内表达。启动子序列可以直接与DNA分子相连,在这种情况下,N端的第一个氨基酸始终是甲硫氨酸,其由ATG起始密码子编码。如果需要,可通过和溴化氰体外培育或通过和细菌甲硫氨酸N-端肽酶体内或体外培育,将N端的甲硫氨酸从蛋白质上切下(EPO-A-0 219 237)。
融合蛋白为直接表达提供了一种备选方案。通常,将编码内源细菌蛋白或其它稳定的蛋白之N端部分的DNA序列与异源编码序列的5′端融合。在表达时,该构建物将提供这两个氨基酸序列的融合物。例如,λ噬菌体细胞基因可以和外源基因的5′端相连并在细菌中表达。所得融合蛋白宜保留一个酶(因子Xa)加工位点,以便将噬菌体蛋白与外源基因切开[Nagai等人(1984)Nature 309:810]。融合蛋白也可用lacZ[Jia等人(1987)Gene 60:197],trpE[Allen等人(1987)J.Biotechnol.5:93;Makoff等人(1989),J.Gen.Microbiol.135:11]以及Chey[EP-A-0-324 647]基因的序列组成。两个氨基酸序列连接处的DNA序列可能编码或不编码可切割的位点。另一个例子是遍在蛋白融合蛋白。这种融合蛋白由遍在蛋白区域组成,该区域宜保留一个酶(例如遍在蛋白特异性加工蛋白酶)加工位点,以便将外源蛋白和遍在蛋白切开。通过这种方法,可以分离获得天然的外源蛋白[Miller等人(1989)Bio/Technology 7:698]。
另外,还可通过产生嵌合的DNA分子来将外源蛋白分泌出细胞,该嵌合的DNA分子编码的融合蛋白含有一个信号肽序列片段,该序列片段能使细菌中的外源蛋白分泌出来[美国专利4,336,336]。信号序列片段通常编码一个信号肽,该信号肽含有疏水性氨基酸,能指导蛋白分泌出细胞。蛋白质被分泌到生长培养基(革兰阳性菌)中或细胞内膜和外膜之间的周质间隙内(革兰阴性菌)。在编码的信号肽片段和外源基因之间宜具有能在体内或体外切割的加工位点。
编码合适信号序列的DNA可以从分泌性细菌蛋白的基因衍生获得,这些基因例如是大肠杆菌外膜蛋白基因(ompA)[Masui等人(1983),《基因表达的实验操作》;Ghrayeb等人(1984)EMBO J.3:2437]以及大肠杆菌碱性磷酸酶信号序列(phoA)[Oka等人(1985)Proc.Natl.Acad.Sci.82:7212]。另一个例子是,可采用各种芽孢杆菌菌株的α淀粉酶基因的信号序列将异源蛋白分泌出枯草芽孢杆菌[Palva等人(1982)Proc.Natl.Acad.Sci.USA 79:5582;EP-A-0 244 042]。
通常,细菌所识别的转录终止序列是位于翻译终止密码子3′的调控区,它和启动子一起侧接在编码序列的两侧。这些序列指导mRNA的转录,而mRNA能被翻译成该DNA所编码的多肽。转录终止序列通常包括约50个核苷酸的DNA序列,该序列能形成帮助终止转录的茎环结构。例子包括衍生自具有强启动子的基因(如大肠杆菌中的trp基因以及其它生物合成的基因)的转录终止序列。
上述组件,包括启动子、信号序列(如果需要)、感兴趣的编码序列以及转录终止序列通常被一起放在表达构建物中。表达构建物通常以复制子的形式维持,例如能在宿主(如细菌)中稳定维持的染色体外元件(如质粒)。复制子具有一个复制系统,从而允许其维持在原核宿主中或进行表达或进行克隆和扩增。另外,复制子可以是高拷贝数或低拷贝数的质粒。高拷贝数质粒的拷贝数大致在约5至200之间,通常在约10至150之间。含有高拷贝数质粒的宿主宜含有至少约10个质粒,更佳的含有至少约20个质粒。根据载体以及外源蛋白对宿主的影响,可以选择高拷贝数或低拷贝数的载体。
另外,表达构建物可以和一个整合载体一起整合入细菌基因组中。整合载体通常含有至少一个与细菌染色体同源的序列,从而允许该载体整合。整合看来是载体和细菌染色体中的同源DNA之间重组引起的。例如,用不同芽孢杆菌菌株的DNA构建的整合载体整合到芽孢杆菌染色体中(EP-A-0 127 328)。整合载体还可包含噬菌体或转座子序列。
通常,染色体外的以及整合的表达构建物均含有可选择的标记,以便选择已经转化的菌株。可选择的标记可在细菌宿主中表达,其包括赋予细菌对药物(如氨苄青霉素、氯霉素、红霉素、卡那霉素(新霉素)和四环素)抗性的基因[Davies等人(1978)Annu.Rev.Microbiol.32:469]。可选择标记还可包括生物合成性基因,如在组氨酸、色氨酸以及亮氨酸生物合成途径中的那些基因。
另外,上述某些组件可以一起放在转化载体中。转化载体通常包含一个可选择标记,如上所述,该载体以复制子形式维持或发展成一个整合载体。
已经开发出了用于转化到许多细菌中的表达和转化载体(无论是染色体外复制子还是整合载体)。例如,已经开发出了用于下列细菌的表达载体:枯草芽孢杆菌[Palva等人,(1982)Proc.Natl.Acad.Sci.USA 79:5582;EP-A-0 036 259和EP-A-0 063 953;WO 84/04541],大肠杆菌[Shimatake等人,(1981)Nature 292:128;Amann等人,(1985)Gene 40:183;Studier等人,(1986)J.Mol.Biol.189:113;EP-A-0 036 776,EP-A-0 136829和EP-A-0 136 907],酪链球菌[Powell等人,(1988)Appl.Environ.Microbiol.54:655];浅青紫链球菌[Powell等人,(1988)Appl.Environ.Mierobiol.54:655],浅青紫链霉菌[US patent 4,745,056].
将外源DNA导入细菌宿主的方法是本领域熟知的,通常包括用氯化钙或其它试剂(如二价阳离子和DMSO)处理对细菌进行转化。DNA还可通过电穿孔方法导入细菌细胞。转化程序通常因待转化的细菌种类而异。例如参见[Masson等人,(1989)FEMSMicrobiol.Lett.60:273;Palva等人,(1982)Proc.Natl.Acad.Sci.USA 79:5582;EP-A-0036 259和EP-A-0 063 953;WO 84/04541,芽孢杆菌],[Miller等人,(1988)Proc.Natl.Acad.Sci.85:856;Wang等人,(1990)J.Bacteriol.172:949,弯曲杆菌],[Cohen等人,(1973)Proc.Natl.Acad.Sci.69:2110;Dower等人,(1988)Nucleic Acids Res.16:6127;Kushner(1978)″用ColE1-衍生的质粒转化大肠杆菌的改进的方法″GeneticEngineering:Proceedings of the International Symposium on Genetic Engineering(H.W.Boyer和S.Nicosia编辑);Mandel等人,(1970)J.Mol.Biol.53:159;Taketo(1988)Biochim.Biophys.Acta 949:318;埃希氏菌],[Chassy等人,(1987)FEMSMicrobiol.Lett.44:173乳酸杆菌];[Fiedler等人,(1988)Anal.Biochem170:38,假单胞菌];[Augustin等人,(1990)FEMS Microbiol.Lett.66:203,葡萄球菌],[Barany等人,(1980)J.Bacteriol.144:698;Harlander(1987)″用电穿孔转化链球菌产乳酸微生物″Streptococcal Genetics(J.Ferretti和R.Curtiss III编辑);Perry等人,(1981)Infect.Immun.32:1295;Powell等人,(1988)Appl.Environ.Microbiol.54:655;Somkuti等人,(1987)Proc.4th Evr.Cong.Biotechnology 1:412,链球菌]。
v.酵母表达
酵母表达系统也是本领域技术人员所知的。酵母启动子是能结合酵母RNA聚合酶并启动下游(3′)编码序列(如结构基因)转录成mRNA的DNA序列。启动子具有一个转录起始区,它通常位于编码序列的5′端附近。该转录起始区通常包括RNA聚合酶结合位点(″TATA″盒)以及一个转录起始位点。酵母启动子可能还有第二个功能区域称为上游激活序列(UAS),如果存在的话,它通常在结构基因的远端。UAS能调节表达(可诱导)。在UAS不存在时,发生组成型表达。表达的调控可能是正作用或负作用的,从而增强或减弱了转录。
酵母是一种发酵生物体,具有活泼的代谢途径,因此编码代谢途径中的酶的序列提供了特别有用的启动子序列。例子包括醇脱氢酶(ADH)(EP-A-0 284 044)、烯醇酶、葡萄糖激酶、葡萄糖-6-磷酸异构酶、甘油醛-3-磷酸-脱氢酶(GAP或GAPDH)、己糖激酶、磷酸果糖激酶、3-磷酸甘油酸变位酶、以及丙酮酸激酶(PyK)(EPO-A-0 329 203)。编码酸性磷酸酶的酵母PHO5基因也提供了有用的启动子序列[Myanohara等人(1983)Proc.Natl.Acad.Sci.USA 80:1]。
另外,非天然存在的合成的启动子也可象酵母启动子一样起作用。例如,一种酵母启动子的UAS序列可以和另一种酵母启动子的转录激活区连接在一起,形成合成的杂合启动子。这种杂合启动子的例子包括与GAP转录激活区相连的ADH调控序列(美国专利No.4,876,197和4,880,734)。杂合启动子的其它例子包括由ADH2、GAL4、GAL10或PHO5基因的调控序列组成的启动子与糖酵解酶基因如GAP或PyK的转录激活区组合(EP-A-0 164 556)。另外,酵母启动子可包括非酵母来源但能结合酵母RNA聚合酶并启动转录的天然存在的启动子。这些启动子的例子包括,尤其是,[Cohen等人,(1980)Proc.Natl.Acad.Sci.USA 77:1078;Henikoff等人,(1981)Nature 283:835;Hollenberg等人,(1981)Curr. Topics Microbiol.Immunol.96:119;Hollenberg等人,(1979)″细菌抗生素抗性基因在酿酒酵母中的表达″Plasmids of Medical,Environmentaland Commercial Importance(K.N.Timmis和A.Puhler编辑);Mercerau-Puigalon等人,(1980)Gene 11:163;Panthier等人,(1980)Curr.Genet.2:109;]。
DNA分子可以在酵母菌胞内表达。启动子序列可以直接与DNA分子相连,在这种情况下,重组蛋白N端的第一个氨基酸始终是甲硫氨酸,其由ATG起始密码子编码。如果需要,可通过和溴化氰体外培育将N端的甲硫氨酸从蛋白质上切下。
象在哺乳动物、杆状病毒以及细菌表达系统中一样,融合蛋白为酵母表达系统提供了一种备选方案。通常,将编码内源酵母蛋白或其它稳定的蛋白之N端部分的DNA序列与异源编码序列的5′端融合。在表达时,该构建物将提供这两个氨基酸序列的融合物。例如,酵母或人超氧化物歧化酶(SOD)基因可以和外源基因5′端相连并在酵母中表达。两个氨基酸序列连接处的DNA序列可能编码或不编码可切割的位点。例如参见EP-A-0 196 056。另一个例子是遍在蛋白融合蛋白。这种融合蛋白由遍在蛋白区域组成,该区域宜保留一个酶(例如遍在蛋白特异性加工蛋白酶)加工位点,以便将外源蛋白和遍在蛋白切开。因此,通过这种方法,可以分离获得天然的外源蛋白(例如WO88/024066)。
另外,还可通过产生嵌合的DNA分子来将外源蛋白从细胞分泌到生长培养基中,该嵌合的DNA分子编码的融合蛋白含有一个前导序列片段,该前导序列片段能使酵母中的外源蛋白分泌出来。较佳的,在编码的前导序列片段和外来基因之间宜具有能在体内或体外切割的加工位点。该前导序列片段通常编码了一个含有疏水性氨基酸的信号肽,其指导蛋白从细胞分泌出来。
编码合适信号序列的DNA可以从分泌性酵母蛋白的基因衍生获得,这些基因例如有酵母转化酶基因(EP-A-0 012 873;JPO.62,096,086)以及A-因子基因(美国专利4,588,684)。另外,非酵母来源的前导序列(如干扰素前导序列)的存在也能提供酵母分泌作用(EP-A-0 060 057)。
较佳的一类分泌前导序列采用了酵母α-因子基因的片段,其含有″pre″信号序列和″pro″区。可采用的α因子片段的类型包括全长pre-proα因子前导序列(约83个氨基酸残基)以及截短的α-因子前导序列(通常约25至50个氨基酸残基)(美国专利4,546,083和4,870,008;EP-A-0 324 274)。采用α-因子前导片段提供分泌作用的其它前导序列包括杂合的α-因子前导序列,其由第一个酵母的pre序列组成但无第二个酵母α因子的pro区域(例如见WO89/02463)。
通常,被酵母识别的转录终止序列是位于翻译终止密码子3′的调控区,其和启动子一起侧接在编码序列的两侧。这些序列指导mRNA的转录,而mRNA能被翻译成该DNA所编码的多肽。转录终止序列和其它酵母识别的终止序列的例子例如是编码糖酵解酶的那些转录终止序列。
上述组件,包括启动子、前导序列(如果需要)、感兴趣的编码序列以及转录终止序列,通常被一起放在表达构建物中。表达构建物通常以复制子的形式保持,例如能在宿主(如酵母或细菌)中稳定保持的染色体外元件(如质粒)。复制子可能具有两个复制系统,从而允许其能维持在例如酵母中进行表达,并能维持在原核宿主进行克隆和扩增。这些酵母-细菌穿梭载体的例子包括YEp24[Botstein等人(1979)Gene 8:17-24],pCL/1[Brake等人,(1984)Proc.Natl.Acad.Sci.USA 81:4642-4646]和YRp17[Stinchcomb等人(1982)J.Mol.Biol.158:157]。另外,复制子可以是高拷贝数或低拷贝数的质粒。高拷贝数质粒的拷贝数大致在约5至200之间,通常在约10至150之间。含有高拷贝数质粒的宿主宜含有至少约10个质粒,更佳的含有至少约20个质粒。根据载体以及外源蛋白对宿主的影响,可以选择高拷贝数或低拷贝数的载体。例如参见Brake等人,同上。
另外,表达构建物可以和一个整合载体一起整合入酵母基因组中。整合载体通常含有至少一个与酵母染色体同源的序列,从而允许该载体整合,最好含有两个同源序列侧接该表达构建物。整合看来是载体和酵母染色体中同源DNA之间重组引起的[Orr-Weaver等人(1983)Methods in Enzymol.101:228-245]。通过选择合适的同源序列插入载体中,可将整合载体导入酵母中某一特定的基因座。见Orr-Weaver等人,同上。可以整合入一个或多个表达构建物,这可能会影响重组蛋白产生的水平[Rine等人(1983)Proc.Natl.Acad.Sci.USA 80:6750]。载体中的染色体序列可以载体中的单个片段形式存在(从而导致整个载体的整合),或是与染色体中的相邻片段同源的两个片段,这两个片段在载体中侧接在表达构建物两侧,从而导致只有表达构建物稳定地整合。
通常,染色体外的以及整合的表达构建物均含有可选择的标记,以便选择已被转化的酵母菌株。可选择标记可包括能在酵母宿主中表达的生物合成基因(如ADE2、HIS4、LEU2、TRP1和ALG7以及G418抗性基因),这些基因分别赋予酵母细胞对衣霉素以及G418的抗性。另外,合适的可选择标记还可能为酵母在毒性化合物(如金属)存在下提供生长能力。例如,CUP1的存在使酵母能在铜离子存在下生长[Butt等人,(1987)Microbiol,Rev.51:351]。
另外,上述某些组件可以一起放在转化载体中。转化载体通常包含一个可选择标记,如上所述,该载体以复制子形式维持或发展成一个整合载体。
已经开发出了用于转化入许多酵母中的表达和转化载体(无论是染色体外复制子还是整合载体)。例如,尤其已经开发出用于下列酵母菌的表达载体:白色念珠菌[Kurtz,等人,(1986)Mol.Cell Biol.6:142],麦芽糖念珠菌[Kunze,等人,(1985)J.Basic Microbiol.25:141],多形汉逊酵母[Gleeson,等人,(1986)J.Gen.Microbiol.132:3459;Roggenkamp等人,(1986)Mol.Gen.Genet.202:302],脆壁克鲁维酵母[Das,等人,(1984)J.Bacteriol.158:1165],乳酸克鲁维酵母[De Louvencourt等人,(1983)J.Bacteriol.154:737;Van den Berg等人,(1990)Bio/Technology8:135],季也蒙毕赤酵母[Kunze等人,(1985)J.Basic Microbiol.25:141],巴斯德毕赤酵母[Cregg,等人,(1985)Mol.Cell.Biol.5:3376;美国专利No.4,837,148和4,929,555],酿酒酵母[Hinnen等人,(1978)Proc.Natl.Acad.Sci.USA 75:1929;Ito等人,(1983)J.Bacteriol.153:163],栗酒裂植酵母[Beach和Nurse(1981)Nature 300:706],以及Yarrowialipolytica[Davidow,等人,(1985)Curr.Genet 10:380471 Gaillardin,等人,(1985)Curr.Genet.10:49]。
将外源DNA导入酵母宿主的方法是本领域熟知的,通常包括用碱阳离子处理原生质球或完整酵母细胞进行转化。转化程序通常因待转化的酵母种类而异。例如参见,[Kurtz等人,(1986)Mol.Cell.Biol.6:142;Kunze等人,(1985)J.Basic Microbiol.25:141;念珠菌属];[Gleeson等人,(1986)J.Gen.Microbiol.132:3459;Roggenkamp等人,(1986)Mol.Gen.Genet.202:302;汉逊酵母];[Das等人,(1984)J.Bacteriol.158:1165;De Louvencourt等人,(1983)J.Bacteriol.154:1165;Van den Berg等人,(1990)Bio/Technology8:135;克鲁维酵母];[Cregg等人,(1985)Mol.Cell.Biol.5:3376;Kunze等人,(1985)J.Basic Microbiol.25:141;美国专利No.4,837,148和4,929,555;毕赤酵母];[Hinnen等人,(1978)Proc.Natl.Acad.Sci.USA 75;1929;Ito等人,(1983)J.Bacteriol.153:163酿酒酵母];[Beach和Nurse(1981)Nature 300:706;裂殖酵母];[Davidow等人,(1985)Curr.Genet.10:39;Gaillardin等人,(1985)Curr.Genet.10:49;Yarrowia]。
抗体
本文所用的术语“抗体”指由至少一个抗体结合位点组成的一个或一组多肽。“抗体结合位点”是一个三维结合空间,其内表面形状和电荷分布与抗原表位的特征互补,从而使抗体与抗原结合。“抗体”例如包括,脊椎动物抗体、杂合抗体、嵌合抗体、人化抗体、经修饰的抗体、单价抗体、Fab蛋白以及单结构域抗体。
针对本发明蛋白的抗体可用于亲和层析、免疫试验以及区别/鉴定奈瑟氏球菌蛋白。
针对本发明蛋白的多克隆和单克隆抗体可用常规方法制得。通常,首先用蛋白来免疫合适的动物,较佳的是小鼠、大鼠、家兔或山羊。由于可获得的血清体积较大,能获得标记的抗家兔和抗山羊抗体,因此对于制备多克隆血清来说,家兔和山羊是较佳的。免疫通常这样进行:将蛋白混合或乳化到盐水(较佳的是佐剂如Freund完全佐剂)中,然后肠胃外(通常是皮下或肌内)注射该混合物或乳剂。每次注射50-200微克的剂量通常就足够了。2-6周后用盐水(较佳的是用Freund不完全佐剂)配的蛋白质注射一次或多次以强化免疫。另外可以用本领域已知的方法进行体外免疫来产生抗体,从本发明的目的来看,认为其与体内免疫等效。多克隆抗血清这样获得:将免疫后的动物血液抽取到玻璃或塑料容器中,25℃培育该血液1小时,然后4℃培育2-18小时。离心(例如1000g 10分钟)回收血清。家兔每次取血可获得约20-50毫升。
用Kohler和Milstein的标准方法[Nature(1975)256:495-96]或其改进方法制备单克隆抗体。通常,如上所述对小鼠或大鼠免疫。然而,并非是对动物取血然后抽提血清,而是取出脾脏(以及任选地取出几个大的淋巴结),将其分离成单细胞。如果需要,可将细胞悬液(在除去非特异性粘附的细胞后)加入包被了蛋白质抗原的板或孔中,对脾细胞进行筛选。表达抗原特异性的膜结合免疫球蛋白的B细胞结合到板上,不象悬液其它物质那样被洗去。然后使所得B细胞或所有解离的脾细胞与骨髓瘤细胞融合形成杂交瘤,培养在选择性培养基(如次黄嘌呤、氨基蝶呤、胸苷培养基,“HAT”)中。通过有限稀释接种所得杂交瘤,并测定特异性结合免疫抗原(且不结合无关抗原)的抗体的产生。然后,体外(例如在组织培养瓶或中空纤维反应器中)或体内(如小鼠腹水中)培养所选的分泌单克隆抗体的杂交瘤。
如果需要,抗体(无论是多克隆还是单克隆抗体)可用常规技术来标记。合适的标记包括荧光团、发色团、放射活性原子(特别是32P和125I)、密电子试剂、酶、以及具有特异性结合配偶的配体。酶通常靠其活性来检测。例如,辣根过氧化物酶通常是检测其将3,3′,5,5′-四甲基联苯胺(TMB)转变成蓝色的能力,可用分光光度计定量测定。“特异性结合配偶”指能以高特异性结合配体分子的蛋白质,例如抗原以及对其有特异性的单克隆抗体的情况。其它特异性结合配偶包括生物素和亲和素或链霉亲和素,IgG和蛋白A,以及本领域已知的许多受体-配体对。应理解,上述内容并非要将各种标记分成不同的类,因为同一标记可在几种不同的模型中起作用。例如,125I可作为放射活性标记,或作为密电子试剂。HRP可作为酶或单抗的抗原。另外,可将各种标记组合以获得所需的效果。例如,在实施本发明中,单抗和亲和素也需要标记,因此,可以用生物素标记单抗,并用标记了125I的亲和素检测其存在,或用标记HRP的抗生物素单抗检测其存在。其它替换和可能性对于本领域普通技术人员来说是显而易见的,所以应认作是属于本发明范围的等价物。
药物组合物
药物组合物可包含本发明的多肽、抗体或核酸。该药物组合物将包含治疗有效量的本发明的多肽、抗体或多核苷酸。
本文所用的术语“治疗有效量”指治疗剂治疗、缓解或预防目标疾病或状况的量,或是表现出可检测的治疗或预防效果的量。该效果例如可通过化学标记或抗原水平来检测。治疗效果也包括生理性症状的减少,例如体温降低。对于某一对象的精确的有效量取决于该对象的体型和健康状况、病症的性质和程度、以及选择给予的治疗剂或治疗剂的组合。因此,预先指定准确的有效量是没用的。然而,对于某给定的状况而言,可以用常规实验来确定该有效量,临床医师是能够判断出来的。
为了本发明的目的,有效的剂量为给予个体约0.01毫克/千克至50毫克/千克或0.05毫克/千克至10毫克/千克的DNA构建物。
药物组合物还可含有药学上可接受的载体。术语“药学上可接受的载体”指用于治疗剂(例如抗体、多肽、基因或其它治疗剂)给药的载体。该术语指这样一些药剂载体:它们本身不诱导产生对接受该组合物的个体有害的抗体,且给药后没有过分的毒性。合适的载体可能是大的、代谢缓慢的大分子,如蛋白质、多糖、聚乳酸(polylacticacid)、聚乙醇酸、氨基酸聚合物、氨基酸共聚物以及无活性的病毒颗粒。这些载体是本领域普通技术人员所熟知的。
本文可用的药学上可接受的盐例如有:无机酸盐,如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等;以及有机酸的盐,如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。在Remington′sPharmaceutical Sciences(Mack Pub.Co.,N.J.1991)中可找到关于药学上可接受的赋形剂的充分讨论。
治疗性组合物中的药学上可接受的载体可含有液体,如水、盐水、甘油和乙醇。另外,这些载体中还可能存在辅助性的物质,如润湿剂或乳化剂、pH缓冲物质等。通常,可将治疗性组合物制成可注射剂,例如作为液体溶液或悬液;还可制成在注射前适合在液体载体中配成溶液或悬浮液的固体形式。脂质体也包括在该药学上可接受的载体定义中。
输药方法
一旦配成本发明的组合物,可将其直接给予对象。待治疗的对象可以是动物;尤其可以治疗人。
直接输送该组合物通常可通过皮下、腹膜内、静脉内或肌内注射或输送至组织间隙来实现。组合物也可输送至病灶区。其它给药方式包括口服和肺给药、栓剂和透皮或经皮肤应用(例如参见WO98/20734)、用针、基因枪或手持喷雾器(hypospray)。治疗剂量方案可以是单剂方案或多剂方案。
疫苗
本发明的疫苗可以是预防性的(即防止感染)或治疗性的(即在感染后治疗疾病)。
这些疫苗包含免疫性抗原、免疫原、多肽、蛋白或核酸,通常与“药学上可接受的载体”组合,这些载体包括本身不诱导产生对接受该组合物的个体有害的抗体的任何载体。合适的载体通常是大的、代谢缓慢的大分子,如蛋白质、多糖、聚乳酸、聚乙醇酸、氨基酸聚合物、氨基酸共聚物、脂质凝集物(如油滴或脂质体)以及无活性的病毒颗粒。这些载体是本领域普通技术人员所熟知的。另外,这些载体可作为免疫刺激剂(“佐剂”)。另外,抗原或免疫原可以和细菌类毒素(如白喉、破伤风、霍乱、幽门螺杆菌等病原体的类毒素)偶联。
增强组合物效果的较佳的佐剂包括但不局限于:(1)铝盐(alum),如氢氧化铝、磷酸铝、硫酸铝等;(2)水包油的乳剂配方(有或没有其它特异性的免疫刺激剂,如胞壁酰肽(见下文)或细菌细胞壁成分),例如,例(a)MF59TM(WO90/14837;《疫苗设计:亚基和佐剂方法》第10章,编者Powell和Newman,Plenum Press 1995),其含有5%鲨烯、0.5%吐温80和0.5%Span 85(任选地含有不同量的MTP-PE(见下文),虽然并不需要),用微量流化器(如110Y型微量流化器(Microfluidics,Newton,MA))制成亚微米级颗粒;(b)SAF,其含有10%鲨烯、0.4%吐温80、5%普卢兰尼克(pluronic)嵌段聚合物L121以及thr-MDP(见下文),微量流化成亚微米级乳剂或涡流振荡产生粒径较大的乳剂,和(c)RibiTM佐剂系统(RAS)(Ribi Immunochem,Hamilton,MT),其含有2%鲨烯、0.2%吐温80以及取自单磷酰脂A(MPL)、二霉菌酸海藻糖酯(TDM)、和细胞壁骨架(CWS)的一种或多种细菌细胞壁组分,较佳的是MPL+CWS(DetoxTM);(3)皂素佐剂,例如可采用StimulonTM(Cambridge Bioscience,Worcester,MA)或从其产生的颗粒,如ISCOM(免疫刺激性复合物);(4)Freund完全佐剂(CFA)和Freund不完全佐剂(IFA);(5)细胞因子,如白介素(如IL-1、IL-2、IL-4、IL-5、IL-6、IL-7、IL-12等)、干扰素(如γ干扰素)、巨噬细胞集落刺激因子(M-CFS)、肿瘤坏死因子(TNF)等;以及(6)作为免疫刺激剂来增强组合物效果的其它物质。Alum和MF59TM是较佳的。
如上所述,胞壁酰肽包括但不局限于,N-乙酰-胞壁酰-L-苏氨酰-D-异谷氨酰胺(thr-MDP)、N-乙酰-去胞壁酰-L-丙氨酰-D-异谷氨酰胺(nor-MDP)、N-乙酰胞壁酰-L-丙氨酰-D-异谷氨酰氨酰基-L-丙氨酸-2-(1′-2′-二棕榈酰-sn-甘油-3-羟基磷酰氧)-乙胺(MTP-PE)等。
免疫原性组合物(如免疫用抗原/免疫原/多肽/蛋白质/核酸,药学上可接受的载体以及佐剂)通常含有稀释剂,如水,盐水,甘油,乙醇等。另外,辅助性物质,如润湿剂或乳化剂、pH缓冲物质等可存在于该此类载体中。
通常,可将免疫原性组合物制成可注射剂,例如作为液体溶液或悬液;还可制成在注射前适合配入液体载体形成溶液或悬液的固体形式。该制剂还可乳化或包封在脂质体中,在上述药学上可接受的载体下增强佐剂效果。
用作疫苗的免疫原性组合物包含免疫学有效量的抗原性或免疫原性多肽,以及上述其它所需的组分。“免疫学有效量”指以单剂或连续剂一部分给予个体的量对治疗或预防是有效的。该用量取决于待治疗个体的健康状况和生理状况、待治疗个体的种类(如非人灵长类等)、个体免疫系统合成抗体的能力、所需的保护程度、疫苗的配方、治疗医师对医疗状况的评估、及其它的相关因素而定。预计该用量将在相对较宽的范围内,可通过常规实验来确定。
常规方法是从肠胃外(皮下、肌内、或透皮/经皮肤(如WO98/20734))途径通过注射给予免疫原性组合物。适合其它给药方式的其它配方包括口服和肺制剂、栓剂和透皮应用。治疗剂量可以是单剂方案或多剂方案。疫苗可以结合其它免疫调节剂一起给予。
作为以蛋白质为基础的疫苗的备选方案,可以采用DNA疫苗接种[例如,Robinson和Torres(1997)Seminars in Immunology 9:271-283;Donnelly等人(1997)Annu Rev.Immunol 15:617-648;见下文]。
基因输送载体
用于输送构建物的基因治疗载体可以口服或全身性给予,其中所述构建物包括本发明治疗剂的编码序列,将其输送给哺乳动物以便在哺乳动物体内表达。这些构建物可利用体内或活体外方式中的病毒或非病毒载体方法。这些编码序列的表达可用内源哺乳动物启动子或异源启动子诱导。编码序列的体内表达可以是组成型的或受调控的。
本发明包括能表达所涉及的核酸序列的基因输送载体。基因输送载体宜为病毒载体,更佳的是逆转录病毒、腺病毒、腺伴随病毒(AAV)、疱疹病毒或甲病毒载体。病毒载体还可以是星状病毒、冠状病毒、正粘病毒、乳多空病毒、副粘病毒、细小病毒、小核糖核酸病毒、痘病毒或披膜病毒的病毒载体。通常参见Jolly(1994)Cancer GeneTherapy 1:51-64;Kimura(1994)Human Gene Therapy 5:845-852;Connelly(1995)Human Gene Therapy 6:185-193;以及Kaplitt(1994)Nature Genetics 6:148-153。
逆转录病毒载体是本领域中熟知的,我们认为任何逆转录病毒基因治疗载体均可用于本发明,包括B、C和D型逆转录病毒、异嗜性逆转录病毒(例如NZB-X1、NZB-X2和NZB9-1(见O′Neill(1985)J.Virol.53:160)广食性逆转录病毒如MCF和MCF-MLV(见Kelly(1983)J.Virol 45:291)、泡沫病毒和慢病毒。见《RNA肿瘤病毒》第2版,ColdSpring Harbor Laboratory,1985。
逆转录病毒基因治疗载体的诸部分可从不同逆转录病毒衍生获得。例如,逆转录载体LTR可以从鼠肉瘤病毒衍生获得,tRNA结合位点可以从Rous肉瘤病毒衍生获得,包装信号从鼠白血病病毒获得,第二链的合成起点从禽类白血病病毒获得。
可将这些重组逆转录病毒载体导入合适的包装细胞系,用来产生转导感受态逆转录病毒载体颗粒(见美国专利5,591,624)。通过将嵌合性整合酶掺入逆转录病毒颗粒,构建逆转录病毒载体,以便将其定点整合到宿主细胞DNA中(见WO96/37626)。较佳的是重组病毒载体是复制缺陷型重组病毒。
适合与上述逆转录病毒载体使用的包装细胞系是本领域中熟知的,很容易制得(见WO95/30763和WO92/05266),并能用来产生能生产重组载体颗粒的生产型细胞系(也称为载体细胞系或“VCL”)。包装细胞系宜从人亲代细胞(如HT1080细胞)或貂亲代细胞系制得,以便消除人血清的灭活作用。
用来构建逆转录病毒基因治疗载体的较佳的逆转录病毒包括禽类白血病病毒、牛白血病病毒、鼠白血病病毒、水貂细胞灶诱导病毒、鼠肉瘤病毒、网状内皮组织增殖病毒和Rous肉瘤病毒。特别佳的鼠白血病病毒包括4070A和1504A(Hartley和Rowe(1976)J Virol 19:19-25),Abelson(ATCC No.VR-999),Friend(ATCCNo.VR-245),Graffi,Gross(ATCC Nol VR-590),Kirsten,Harvey肉瘤病毒和Rauscher(ATCC No.VR-998)以及莫洛尼鼠白血病病毒(ATCC No.VR-190)。这些逆转录病毒可以从保藏机构或保藏中心如Rockville,Maryland的美国典型培养物保藏中心(ATCC)获得,或用常用的技术从已知来源分离获得。
可用于本发明的典型的已知逆转录病毒基因治疗载体包括在以下专利申请中描述的那些载体:GB2200651,EP0415731,EP0345242,EP0334301,WO89/02468;WO89/05349,WO89/09271,WO90/02806,WO90/07936,WO94/03622,WO93/25698,WO93/25234,WO93/11230,WO93/10218,WO91/02805,WO91/02825,WO95/07994,US 5,219,740,US 4,405,712,US 4,861,719,US 4,980,289,US 4,777,127,US 5,591,624.另见Vile(1993)Cancer Res 53:3860-3864;Vile(1993)Cancer Res 53:962-967;Ram(1993)Cancer Res 53(1993)83-88;Takamiya (1992)J Neurosci Res 33:493-503;Baba(1993)J Neurosurg 79:729-735;Mann(1983)Cell 33:153;Cane(1984)Proc Natl AcadSci 81:6349;以及Miller(1990)Human Gene Therapy1。
人腺病毒基因治疗载体也是本领域中已知的,可用于本发明。例如参见Berkner(1988)Biotechniques 6:616和Rosenfeld(1991)Science 252:431,以及WO93/07283,WO93/06223和WO93/07282。可用于本发明的典型的已知的腺病毒基因治疗载体包括在上述文献以及下述专利中描述的那些例子:WO94/12649,WO93/03769,WO93/19191,WO94/28938,WO95/11984,WO95/00655,WO95/27071,WO95/29993,WO95/34671,WO96/05320,WO94/08026,WO94/11506,WO93/06223,WO94/24299,WO95/14102,WO95/24297,WO95/02697,WO94/28152,WO94/24299,WO95/09241,WO95/25807,WO95/05835,WO94/18922和WO95/09654。另外,可以采用Curiel(1992)Hum.Gene Ther.3:147-154中描述的给予和已杀死腺病毒相连的DNA的方法。本发明的基因输送载体还包括腺病毒伴随病毒(AAV)载体。用于本发明的这种载体的主要且较佳的例子是Srivastava,WO93/09239中公开的AAV-2为基的载体。最佳的AAV载体包含两个AAV反向末端重复序列,其中通过核苷酸替换对天然D-序列进行修饰,使至少5-18个天然的核苷酸(较佳的至少10-18个天然核苷酸,最佳的10个天然核苷酸)被保留下来,而D-序列其余的核苷酸缺失或被非天然核苷酸取代。AAV末端反向重复序列的天然D-序列是每个AAV反向末端重复序列中不参与HP形成的20个连串核苷酸的序列(即每一端有一个序列)。非天然的替换核苷酸可以是天然D-序列同一位置中所见核苷酸以外的任何核苷酸。其它可采用的典型的AAV载体是pWP-19、pWN-1,两者均公开在Nahreini(1993)Gene 124:257-262中。这样的AAV的另一个例子是psub201(见Samulski(1987)J.Virol.61:3096)。另一个典型的AAV载体是Double-DITR载体。Double-D ITR载体的构建方案公开在美国专利5,478,745中。还有其它的载体公开在Carter的美国专利4,797,368和Muzyczka的美国专利5,139,941、Chartejee的美国专利5,474,935和Kotin的WO94/288157中。可用于本发明的另一个AAV载体例子是SSV9AFABTKneo,它含有AFP增强子和白蛋白启动子,并且主要指导肝内表达。其结构和构建方案公开在Su(1996)Human Gene Therapy 7:463-470中。其它的AAV基因治疗载体在美国专利5,354,678,5,173,414,5,139,941和5,252,479中有所描述。
本发明的基因治疗载体还包括疱疹载体。主要且较佳的例子是含有编码胸苷激酶多肽的序列的单纯疱疹病毒载体,如公开在US5,288,641和EP0176170(Roizman)中的那些。其它典型的单纯疱疹病毒载体包括WO95/04139中公开的HFEM/ICP6-LacZ(Wistar Institute)、Geller(1988)Science 241:1667-1669以及WO90/09441和WO92/07945中公开的pHSVlac、Fink(1992)Human Gene Therapy 3:11-19中描述的HSV Us3::pgC-lacZ、EP 0453242(Breakefield)中描述的HSV 7134、2 RH 105和GAL4以及保藏于ATCC、保藏号为ATCC VR-977和ATCC VR-260的那些病毒。
还考虑到甲病毒基因治疗载体也可用于本发明。较佳的甲病毒载体是新培斯病毒载体。披膜病毒、Semliki Forest病毒(ATCC VR-67;ATCC VR-1247)、Middleberg病毒(ATCC VR-370)、Ross River病毒(ATCC VR-373;ATCC VR-1246)、委内瑞拉马脑炎病毒(ATCC VR923;ATCC VR-1250;ATCC VR-1249;ATCC VR-532)、以及在美国专利5,091,309,5,217,879以及WO92/10578中描述的那些。更具体地说,可以采用1995年3月15日提交的美国申请08/405,627、WO94/21792、WO92/10578、WO95/07994、US 5,091,309和US 5,217,879中描述的那些甲病毒载体。这些甲病毒可以从保藏机构或保藏中心如Rockville,Maryland的ATCC获得,或用常用的技术从已知来源分离获得。较佳的是,采用细胞毒性减少的甲病毒载体(见USSN08/679640)。
DNA载体系统,如真核分层的(layered)表达系统,也可用于表达本发明的核酸。关于真核分层的表达系统详见WO95/07994。较佳的,本发明的真核分层表达系统宜从甲病毒载体衍生获得,更佳的从新培斯病毒载体衍生获得。
适用于本发明的其它病毒载体包括:从脊髓灰质炎病毒衍生的病毒载体,例如ATCC VR-58以及在Evans,Nature 339(1989)385和Sabin(1973)J.Biol.Standardization 1:115中描述的那些;鼻病毒,例如ATCC VR-1110以及在Arnold(1990)J Cell Biochem L401中描述的那些;痘病毒,如金黄色痘病毒或牛痘病毒,例如ATCCVR-111和ATCC VR-2010,以及在Fisher-Hoch(1989)Proc Natl Acad Sci 86:317;Flexner(1989)Ann NY Acad Sci 569:86,Flexner(1990)Vaccine 8:17;US 4,603,112,US4,769,330以及WO89/01973中描述的那些;SV40病毒,例如ATCC VR-305以及在Mulligan(1979)Nature 277:108和Madzak(1992)J Gen Virol 73:1533中描述的那些;流感病毒,例如ATCC VR-797以及用例如US 5,166,057和Enami(1990)Proc Natl AcadSci 87:3802-3805;Enami和Palese(1991)J Virol 65:2711-2713;Luytjes(1989)Cell59:110中所述的用反基因技术制得的重组流感病毒(另见McMichael(1983)NEJ Med309:13,Yap(1978)Nature 273:238以及Nature(1979)277:108);EP-0386882和Buchschacher(1992)J.Virol.66:2731中描述的人免疫缺陷病毒;麻疹病毒,例如ATCCVR-67和VR-1247,以及EP-0440219中描述的那些;奥拉病毒,例如ATCC VR-368;Bebaru病毒,例如ATCC VR-600和ATCC VR-1240;Cabassou病毒,例如ATCCVR-922;屈曲病毒,例如ATCC VR-64和ATCC VR-1241;Fort Morgan病毒,例如ATCC VR-924;Getah病毒,例如ATCC VR-369和ATCC VR-1243;Kyzylagach病毒,例如ATCC VR-927;Mayaro病毒,例如ATCC VR-66;Mucambo病毒,例如ATCCVR-580和ATCC VR-1244;Ndumu病毒,例如ATCC VR-371;Pixuna病毒,例如ATCC VR-372和ATCC VR-1245;Tonate病毒,例如ATCC VR-925;Triniti病毒,例如ATCC VR-469;Una病毒,例如ATCC VR-374;Whataroa病毒,例如ATCC VR-926;Y-62-33病毒,例如ATCC VR-375;O′Nyong病毒,东部脑炎病毒,例如ATCC VR-65和ATCC VR-1242;西部脑炎病毒,例如ATCC VR-70,ATCC VR-1251,ATCC VR-622和ATCC VR-1252;和冠状病毒,例如ATCC VR-740和在Hamre(1966)Proc Soc ExpBiolMed 121:190中描述的那些。
将本发明的组合物输送至细胞内并不局限于上述病毒载体。还可采用其它输送方法和介质,例如核酸表达载体、与已被杀死的腺病毒单独相连或不相连的聚阳离子凝缩的DNA(例如参见1994年12月30日美国申请No.08/366,787和Curiel(1992)HumGene Ther 3:147-154)、配体连接的DNA(例如参见Wu(1989)J.Biol.Chem.264:16985-16987)、真核细胞输送载体细胞(例如参见1994年5月9日提交的美国申请No.08/240,030以及美国申请No.08/404,796)、光聚合水凝胶材料的沉淀、手提式基因转移颗粒枪(如美国专利5,149,655所述)、电离辐射(如US5,206,152和WO92/11033所述)、核电荷中和或与细胞膜融合。其它方法在Philip(1994) Mol CellBiol 14:2411-2418以及Woffendin(1994)Proc.Natl.Acad.Sci.91:1581-1585中有所描述。
可以采用颗粒介导的基因转移,例如参见美国申请No.60/023,867。简言之,可将序列插入含有控制高水平表达的常规序列的常规载体中,然后和合成性基因转移分子一起培育,这些基因转移分子例如是聚合性DNA-结合阳离子(如聚赖氨酸、鱼精蛋白和白蛋白),其与细胞寻靶配体(如脱唾液酸血清类粘蛋白(如Wu和Wu(1987)J.Biol.Chem.262:4429-4432所述)、胰岛素(如Hucked(1990)Biochem Pharmacol 40:253-263所述)、半乳糖(如Plank(1992)Bioconjugate Chem 3:533-539所述)、乳糖或运铁蛋白相连。
还可使用裸露的DNA。典型的裸露DNA导入方法在WO 90/11902和US5,580,859中有所描述。用可生物降解的乳胶珠可以改善摄取效果。在对珠粒的胞吞作用开始后,包裹DNA的乳胶珠粒被有效地运输到细胞中。通过处理珠粒以提高其疏水性可进一步改进该方法,从而有助于破坏核内体和将DNA释放到细胞质中。
可作为基因输送载体的脂质体在US 5,422,120,WO95/13796,WO94/23697,WO91/14445和EP-524,968中有所描述。如USSN 60/023,867中所描述的,在非病毒输送时,可将编码多肽的核酸序列插入含有控制高水平表达的常规序列的常规载体中,然后和合成性基因转移分子一起培育,这些基因转移分子例如是聚合性DNA-结合阳离子(如聚赖氨酸、鱼精蛋白和白蛋白),其与细胞寻靶配体(如脱唾液酸血清类粘蛋白、胰岛素、半乳糖、乳糖或运铁蛋白)相连。其它输送系统包括采用脂质体来包裹DNA,该DNA所含基因在各种组织特异性或活性普遍存在的启动子控制下。适用的其它非病毒输送系统包括机械输送系统,如Woffendin等人(1994)Proc.Natl.Acad.Sci.USA 91(24):11581-11585中描述的方法。另外,该系统的编码序列和表达产物可以通过光聚合的水凝胶材料的沉淀来输送。可用来输送编码序列的其它常规基因输送方法例如包括,用手提式基因转移颗粒枪(如美国专利5,149,655所述);用电离辐射来激活转移的基因(如US 5,206,152和WO92/11033所述)。
典型的脂质体和聚阳离子基因输送载体在下列文献中有所描述:US 5,422,120和4,762,915;WO95/13796;WO94/23697;WO91/14445;EP-0524968;Stryer,Biochemistry,236-240页(1975)W.H.Freeman,San Francisco;Szoka(1980)BiochemBiophys Acta 600:1;Bayer(1979)Biochem Biophys Acta 550:464;Rivnay(1987)MethEnzymol 149:119;Wang(1987)Proc Natl Acad Sci 84:7851;Plant(1989)Anal Biochem176:420。
多核苷酸组合物可包含治疗有效量的基因治疗载体,其定义如上所述。出于本发明的目的,有效的剂量是给予个体约0.01毫克/千克至50毫克/千克或0.05毫克/千克至10毫克/千克的DNA构建物。
输送方法
一旦配制成后,本发明的多核苷酸组合物可以以下方式给予:(1)直接给予对象;(2)活体外输送至从对象衍生获得的细胞;或(3)体外表达重组蛋白。待治疗的对象可以是哺乳动物或鸟类。另外,也可对人进行治疗。
直接输送该组合物通常可通过皮下、腹膜内、静脉内或肌内注射或输送至组织间隙来实现。组合物也可给予病灶区。其它给药方式包括口服和肺给药、栓剂和透皮或经皮肤应用(例如参见WO98/20734)、用针、基因枪或手持喷雾器(hypospray)。治疗剂量方案可以是单剂方案或多剂方案。
活体外输送以及将转化的细胞重新植入对象体内的方法是本领域所熟知的,在例如WO93/14778中有所描述。用于活体外应用的细胞例子例如包括:干细胞、尤其是造血干细胞、淋巴细胞、巨噬细胞、树突细胞或肿瘤细胞。
通常,对于活体外和体外应用,核酸的输送可通过以下步骤来实现,例如有葡聚糖介导的转染、磷酸钙沉淀、Polybrene介导的转染、原生质体融合、电穿孔、将多核苷酸包囊在脂质体中以及将DNA直接显微注射到胞核中,所有这些均是本领域所熟知的。
多核苷酸和多肽药物组合物
除了上述的药学上可接受的载体和盐外,多核苷酸和多肽组合物中还可采用下列附加试剂。
A.多肽
一个例子是多肽,其包括但不局限于:脱唾液酸血清类粘蛋白(ASOR);运铁蛋白;脱唾液酸糖蛋白;抗体;抗体片段;铁蛋白;白介素;干扰索;粒细胞-巨噬细胞集落刺激因子(GM-CSF);粒细胞集落刺激因子(G-CSF)、巨噬细胞集落刺激因子(M-CSF)、干细胞因子和促红细胞生成素。还可使用病毒抗原,如包膜蛋白。另外,可用来自其它侵袭性生物的蛋白,例如恶性疟疾疟原虫的环孢子蛋白的17个氨基酸的肽(称为RII)。
B.激素,维生素等
其它可包括的种类例如是:激素、类固醇、雄激素、雌激素、甲状腺激素或维生素、叶酸。
C.聚亚烷基、多糖等
另外,聚(亚烷基)二醇可以和所需的多核苷酸/多肽组合在一起。在一个较佳的实施方案中,聚(亚烷基)二醇是聚乙二醇。另外,可以加入单糖、二糖或多糖。在此方面的一个较佳实施方案中,多糖是葡聚糖或DEAE-葡聚糖。另外有脱乙酰壳多糖和聚交酯-聚乙醇酸内酯共聚物。
D.脂质和脂质体
所需的多核苷酸/多肽还可在输送给对象或对象衍生的细胞之前包裹在脂质中或包裹在脂质体中。
脂质包裹通常用能稳定结合或捕获并保留核酸的脂质体来实现。凝缩的多核苷酸与脂质制剂之比可以变化,但是通常在约1∶1(毫克DNA∶微摩尔脂质)左右,或脂质多些。关于脂质体作为输送核酸的载体的综述参见Hug和Sleight(1991)Biochim.Biophys.Acta.1097:1-17;Straubinger(1983)Meth.Enzymol.101:512-527。
用于本发明的脂质体制剂包括阳离子(带正电荷)、阴离子(带负电荷)和中性制剂。阳离子脂质体已证明能以有功能的形式介导质粒DNA的胞内输送(Felgner(1987)Proc.Natl.Acad.Sci.USA 84:7413-7416);mRNA(Malone(1989)Proc.Natl.Acad.Sci.USA86:6077-6081);和纯化的转录因子(Debs(1990)J.Biol.Chem.265:10189-10192)的胞内输送。
阳离子脂质体很容易购得。例如,N[1-2,3-二油烯基氧)丙基]-N,N,N-三乙铵(DOMTA)脂质体可以Lipofectin的商品名从GIBCO BRL,Grand Island,NY购得。(另见Felgner,同上)。其它市售的脂质体包括transfectace(DDAB/DOPE)和DOTAP/DOPE(Boerhinger)。其它阳离子脂质体可用本领域熟知的方法从易购得的材料制得。例如参见,Szoka(1978)PNAS 75:4194-4198;WO90/11092关于合成DOTAP(1,2-二(油酰基氧)-3-(三甲基铵溶)丙烷)脂质体的描述。
同样,阴离子和中性脂质体也很容易获得,例如购自Avanti PolarLipids(birmingham,AL),或容易用易购得的材料制得。这些材料包括磷脂酰胆碱、胆固醇、磷脂酰乙醇胺、二油酰基磷脂酰胆碱(DOPC)、二油酰基磷脂酰甘油(DOPG)、二油酰基磷脂酰乙醇胺(DOPE)。这些材料还能以合适比例与DOTMA和DOTAP原料混合。用这些材料制备脂质体的方法是本领域熟知的。
脂质体可包含多层泡囊(MLV),小的单层泡囊(SUV)、或大的单层泡囊(LUV)。各种脂质体-核酸复合物可用本领域已知的方法制得。例如参见Straubinger(1983)Meth.Immunol.101:512-527;Szoka(1978)Proc.Natl.Acad.Sci.USA 75:4194-4198;Papahadjopoulos(1975)Biochim.Biophys.Acta 394:483;Wilson(1979)Cell17:77);Deamer和Bangham(1976)Biochim.Biophys.Acta 443:629;Ostro(1977)Biochem.Biophys.Res.Commun.76:836;Fraley(1979)Proc.Natl.Acad.Sci.USA 76:3348);Enoch和Strittmatter(1979)Proc.Natl.Acad.Sci.USA 76:145;Fraley(1980)J.Biol.Chem.(1980)255:10431;Szoka和Papahadjopoulos(1978)Proc.Natl.Acad.Sci.USA 75:145;以及Schaefer-Ridder(1982)Science 215:166。
E.脂蛋白
另外,脂蛋白也可加入待输送的多核苷酸/多肽中。采用的脂蛋白的例子包括:乳糜微粒、HDL、IDL、LDL和VLDL。还可采用这些蛋白的突变体、片段或融合物。另外,可采用天然存在的脂蛋白的修饰物,例如乙酰化的LDL。这些脂蛋白能使多核苷酸的输送指向表达脂蛋白受体的细胞。较佳的,如果待输送的多核苷酸中加入了脂蛋白,则组合物中不加入其它寻靶配体。
天然存在的脂蛋白包含脂质和蛋白部分。蛋白部分称为脱辅基蛋白。目前,已经分离并鉴定了脱辅基蛋白A、B、C、D和E。其中至少有两个含有几种蛋白,用罗马数字AI、AII、AIV;CI、CII、CIII命名。
脂蛋白可包含多个脱辅基蛋白。例如,天然存在的乳糜微粒包含A、B、C和E,随着时间的推移,这些脂蛋白失去A,得到C和E脱辅基蛋白。VLDL包含A、B、C、和E脱辅基蛋白,LDL包含脱辅基蛋白B;HDL包含脱辅基蛋白A、C和E。
这些脱辅基蛋白的氨基酸是已知的,并且在下列文献中有所描述:Breslow(1985)Annu Rev.Biochem 54:699;Law(1986)Adv.Exp Med.Biol.151:162;Chen(1986)J BiolChem 261:12918;Kane(1980)Proc Natl Acad Sci USA 77:2465;和Utermann(1984)Hum Genet 65:232。
脂蛋白含有各种脂质,包括甘油三酯、胆固醇(游离的和酯型)以及磷脂。天然存在的脂蛋白中脂质的组成是不同的。例如,乳糜微粒主要含甘油三酯。关于天然存在的脂蛋白的脂质含量更详细的描述可在例如Meth.Enzymol.128(1986)中找到。选择脂质的组成,以使脱辅基蛋白的构型与受体结合活性相符。还可选择脂质的组成,以促进与多核苷酸结合分子的疏水性相互作用和结合。
天然存在的脂蛋白可以用诸如超离心方法从血清中分离出来。这些方法在Meth.Enzymol.(同上);Pitas(1980)J.BioChem.255:5454-5460以及Mahey(1979)J Clin.Invest64:743-750中有所描述。脂蛋白还可在体外产生,或通过在所需宿主细胞中表达脱辅基蛋白基因的重组方法产生。例如参见Atkinson(1986)Annu Rev Biophys Chem 15:403和Radding(1958)Biochim Biophys Acta 30:443。脂蛋白也可购自商业供应商,如Biomedical Techniologies,Inc.,Stoughton,Massachusetts,USA。关于脂蛋白的进一步描述可在Zuckermann等人的PCT/US97/14465中找到。
F.聚阳离子试剂
聚阳离子试剂可以与或不与脂蛋白一起包括在含待输送的所需多核苷酸/多肽的组合物中。
聚阳离子试剂通常在生理性相关的pH下表现出净的正电荷,并能中和核酸的电荷,以有助于输送至所需位置。这些试剂具有体外、活体外和体内的用途。聚阳离子试剂可通过肌内或皮下等途径将核酸输送至活的对象。
下面是用作聚阳离子试剂的多肽例子:聚赖氨酸、聚精氨酸、聚鸟氨酸和鱼精蛋白。其它例子包括组蛋白、鱼精蛋白、人血清白蛋白、DNA结合蛋白、非组蛋白染色体蛋白、DNA病毒的外壳蛋白,如(X174,转录因子还含有结合DNA的结构域,因此可用作核酸浓缩剂。简言之,转录因子如C/CEBP、c-jun、c-fos、AP-1、AP-2、AP-3、CPF、Prot-1、Sp-1、Oct-1、Oct-2、CREP、和TFIID含有结合DNA序列的基础性结构域。
聚阳离子有机试剂包括:精胺、亚精胺和腐胺。
从上面的清单可以推出聚阳离子试剂的尺寸和生理性能,以构建其它多肽聚阳离子试剂或产生合成的聚阳离子试剂。
可采用的合成聚阳离子试剂例如包括,DEAE-葡聚糖、polybrene。LipofectinTM和lipofectAMINETM是和多核苷酸/多肽组合时形成聚阳离子复合物的单体。
免疫诊断试验
本发明的奈瑟氏球菌抗原可用于免疫试验来检测抗体水平(或相反,可用抗奈瑟氏球菌抗体来检测抗原水平)。根据明确的免疫试验,可以开发出重组抗原,以代替侵入性诊断性方法。针对生物学样品(例如包括血液或血清样品)中的奈瑟氏球菌蛋白的抗体可以被检测出来。免疫试验的设计可作很大变化,其各种方案均是本领域中已知的。免疫试验的方案可采取例如竞争性、或直接反应或夹心型试验。例如方案还可采用固体支持物,或可以采用免疫沉淀法。大多数试验涉及采用有标记的抗体或多肽;该标记例如可以是荧光标记、化学发光标记、放射活性标记或染料分子。放大探针信号的试验也是已知的;其例子是采用生物素和亲和素的试验,酶标记的和介导的免疫试验,如ELISA试验。
将合适的材料(包括本发明的组合物)以及进行试验所需的其它试剂和材料(例如合适的缓冲液、盐溶液等)和合适的试验说明书包装到合适的容器中,构成适用于免疫诊断且含有适当标记试剂的试剂盒。
核酸杂交
“杂交”指两个核酸序列相互之间通过氢键而结合。通常,一个序列被固定到固体载体中,另一个将游离于溶液内。然后,在有利于形成氢键的条件下使两个序列相互接触。影响这种结合的因素包括:溶剂的类型和体积;反应温度;杂交时间;搅拌;封闭液相序列与固相载体非特异性附着的试剂(Denhardt′s试剂或BLOTTO);序列的浓度;是否用化合物来增加序列结合的速度(硫酸葡聚糖或聚乙二醇);以及杂交后洗涤条件的严谨程度。见Sambrook等人[同上]第2卷,第9章,9.47至9.57页。
“严谨性”指有利于非常相似的序列与不同序列发生结合的杂交反应条件。例如,应选择温度和盐浓度的组合,使温度比所研究的杂交物的Tm计算值低大约120至200℃。温度和盐浓度在前期初步实验中常可通过经验来确定,在初步实验中,固定在滤膜上的基因组DNA样品与感兴趣的序列杂交,然后在不同的严谨度条件下洗涤。见Sambrook等人第9.50页。
在进行例如Southern印迹时,要考虑的变量是(1)待印迹的DNA的复杂性以及(2)探针与受检测序列之间的同源性。对于高度复杂的真核基因组中的单拷贝基因,待研究片段的总量可以在10的一个数量级范围内变化,质粒为0.1至1微克,或将噬菌体消化至10-9至10-8克。对于复杂性较低的多核苷酸,可以采用实际上更短的印迹、杂交以及接触时间,更少量的起始多核苷酸,以及比活更低的探针。例如,从1微克酵母DNA开始,用仅仅1小时的接触时间,印迹2小时,然后和108cpm/μg的探针杂交4-8小时,就可以检测出单拷贝酵母基因。对于单拷贝哺乳动物基因而言,一种保守的方法是从10微克DNA开始,印迹过夜,在10%硫酸葡聚糖存在下用108cpm/μg以上的探针杂交过夜,导致接触时间约为24小时。
有几个因素可能会影响探针与感兴趣片段之间的DNA-DNA杂交体的解链温度(Tm),因而影响杂交和洗涤的合适条件。在许多情况下,探针并非与片段100%同源。其它常常遇到的变量包括杂交序列的长度和G+C总含量,以及杂交缓冲液的离子强度和甲酰胺含量。所有这些因素的作用可近似表示成一个方程式:
Tm=81+16.6(log10Ci)+0.4[%(G+C)]-0.6(%甲酰胺)-600/n-1.5(%错配)
其中Ci是盐浓度(单价离子),n是杂交物碱基对的长度(对Meinkoth和Wahl(1984)Anal.Biochem.138:267-284中的稍稍作了修改)。
在设计杂交实验时,影响核酸杂交的一些因素可以方便地予以改变。杂交和洗涤时的温度以及洗涤时的盐浓度的调节最为简单。随着杂交温度(即严谨度)的升高,非同源链之间发生杂交的可能性变得更少,结果背景值降低。如果放射性标记的探针并非与固定的片段完全同源(这在基因家族和种间杂交实验中是常见的),则必须降低杂交温度,而背景值将会增加。洗涤温度以类似的方式影响杂交带的强度和背景值的程度。洗涤的严谨性也随盐浓度的降低而升高。
通常,在50%甲酰胺存在下的方便的杂交温度是:对于靶片段同源性达95%至100%的探针而言,是42℃;对于同源性为90%至95%的探针,为37℃;对于同源性为85%和90%的探针,为32℃。对于较低的同源性,应用上述方程式应相应地降低甲酰胺含量和调节温度。如果探针和靶片段之间的同源性是未知的,则最简单的方法是从非严谨的杂交和洗涤条件开始。如果在放射自显影后发现了非特异性的条带或高背景值,则可在高严谨性下洗涤滤膜,并重新曝光。如果曝光所需时间使得该方法不切实际,则应平行检验几种杂交和/或洗涤严谨性。
核酸探针试验
采用本发明的核酸探针的方法(如PCR、分支DNA探针试验或印迹技术)能确定cDNA或mRNA的存在。如果探针和本发明的序列能形成稳定地足以被检测到的双链体或双链复合物,则称探针与本发明的序列“杂交”。
核酸探针将与本发明的奈瑟氏球菌核苷酸序列(包括有义和反义链)杂交。尽管有许多不同的核苷酸序列编码该氨基酸序列,但是天然的奈瑟氏球菌序列是较佳的,因为它是实际存在于细胞中的序列。mRNA代表一种编码序列,因此探针应与该编码序列互补;单链cDNA与mRNA互补,因此cDNA探针应与非编码序列互补。
探针序列无需和奈瑟氏球菌序列(或其互补体)相同,序列以及长度的一些差异能增加试验的灵敏度,如果核酸探针能和靶核苷酸形成能被检测的双链体的话。另外,核酸探针可包括其它核苷酸,以使形成的双链体稳定。其它奈瑟氏球菌序列也是有帮助的,可作为检测形成的双链体的标记。例如,非互补的核苷酸序列可以和探针的5′端相连,探针序列的其余部分与奈瑟氏球菌序列互补。或者,非互补的碱基或较长的序列能散布到探针中,只要探针序列与奈瑟氏球菌序列有足够的互补性以便与其杂交从而形成能被检测的双链体。
探针的确切长度和序列将取决于杂交条件,如温度,盐浓度等。例如,对于诊断应用,根据分析物序列的复杂程度,核酸探针通常含有至少10-20个核苷酸,较佳的有15-25个,更佳的有至少30个核苷酸,但是也可短于该长度。短的引物通常需要温度较低,以便和模板形成足够稳定的杂交复合物。
探针可用合成方法产生,例如Matteucci等人[J.Am.Chem.Soc.(1981)103:3185]的方法或Urdea等人[Proc.Natl.Acad.Sci.USA(1983)80:7461]的方法,或用市售的自动寡核苷酸合成仪合成。
可以根据偏好选择探针的化学性质。对于某些应用,DNA或RNA是合适的。对于其它的应用,可以加入修饰,例如骨架修饰,如硫代磷酸酯或甲基磷酸酯,可用来增加体内半衰期,改变RNA亲和力,增加核酸酶抗性等[例如参见Agrawal和Iyer(1995)Curr Opin Biotechnol 6:12-19;Agrawal(1996)TIBTECH 14:376-387];还可采用类似物如肽核酸[例如参见Corey(1997)TIBTECH 15:224-229;Buchardt等人(1993)TIBTECH 11:384-386]。
另外,聚合酶链反应(PCR)是另一个熟知的检测少量靶核酸的手段。该试验在Mullis等人[Meth.Enzymol.(1987)155:335-350];美国专利4,683,195和4,468,202中有所描述。用两个“引物”核苷酸与靶核酸杂交,来引导反应。引物可包含不与扩增靶序列(或其互补序列)杂交的序列,以帮助双链体的稳定性,或例如可插入一个简便的限制性位点。这些序列通常侧接所需的奈瑟氏球菌序列。
利用最初的靶核酸作为模板,热稳定的聚合酶能从引物产生靶核酸的拷贝。在聚合酶产生临界量的靶核酸后,它们可用较传统的方法(如Southern印迹)来检测。当采用Southern印迹方法时,标记的探针将与奈瑟氏球菌序列(如其互补序列)杂交。
另外,mRNA或cDNA也可用Sambrook等人[同上]描述的传统印迹技术来检测。用凝胶电泳可纯化并分离利用聚合酶从mRNA产生的mRNA或cDNA。然后,将凝胶上的核酸印迹到固相载体如硝酸纤维素上。使固相载体与标记的探针接触,然后洗涤除去所有未杂交的探针。然后,检测含有标记探针的双链体。该探针通常用放射活性物质作标记。
附图简述
图1-7显示了实施例1、2、3、7、13、16和19中ORF40、38、44、52、114、41和124的序列分析和生化数据。M1和M2是分子量标记。箭头表示主要重组产物的位置,或在Western印迹中,表示主要的脑膜炎奈瑟氏球菌免疫反应性条带的位置。TP表示脑膜炎奈瑟氏球菌总蛋白抽提物;OMV表示脑膜炎奈瑟氏球菌外膜泡囊制备物。在杀菌试验的结果中:菱形(◆)表示免疫前的数据;三角(▲)表示GST对照数据;圆圈(●)表示脑膜炎奈瑟氏球菌重组蛋白的数据。计算机分析显示了亲水性曲线(上方)、抗原性指数曲线(中间)以及AMPHI分析(下方)。用AMPHI程序预测T-细胞表位[Gao等人(1989)J.Immunol.143:3007;Roberts等人(1996)AIDS Res Hum Retrovir12:593;Quakyi等人(1992)Scand J Immunol增版11:9],该程序可从DNASTAR,Inc(1228 South Park Street,Madison,Wisconsin 53715 USA)的Protean软件包中获得。
具体实施方式
下列实施例描述已经在脑膜炎奈瑟氏球菌中鉴定的核酸序列及其推定的翻译产物。并非所有的核酸序列都是完整的,即它们编码的不是全长野生型蛋白。认为目前本文所述的所有DNA序列没有一个在淋病奈瑟氏球菌中有明显的同系物。
实施例总体上采用下列形式:
●脑膜炎奈瑟氏球菌(B株)中已作鉴定的核苷酸序列
●该序列推定的翻译产物
●根据数据库比较的翻译产物的计算机分析结果
●脑膜炎奈瑟氏球菌(A株)中鉴定的对应的基因和蛋白序列
●暗示可能具有合适抗原性的蛋白的特性描述
●生物化学分析(表达、纯化、ELISA、FACS等)的结果
实施例通常包括细菌种属和株系之间的序列同源性细节情况。序列相似的蛋白质其结构和功能通常是相似的,同源性通常表示有共同的进化起源。广泛采用了与功能已知的蛋白序列进行比较,作为赋予新序列推定蛋白功能的指南,在全基因组分析中证明这是特别有用的。
在NCBI(http://www.ncbi.nlm.nih.gov)用BLAST、BLAST2、BLASTn、BLASTp、tBLASTn、BLASTx、和tBLASTx算法进行序列比较[例如参见Altschul等人(1997)″Gapped BLAST和PSI-BLAST:新一代的蛋白数据库搜索程序″Nucleic AcidsResearch 25:2289-3402]。对下列数据库进行搜索:非冗长的GenBank+EMBL+DDBJ+PDB序列和非冗长的GenBank CDS翻译+PDB+SwissProt+SPupdate+PIR序列。
核苷酸序列中的点(例如实施例12中的288位)代表为了维持读码框而任意导入的核苷酸。同样,除去带双划线的核苷酸。小写字母(如实施例12中的589位)代表在独立测序反应的序列对比时出现了多义性(实施例中的一些核苷酸序列是通过合并两个或多个实验的结果而获得的)。
用根据Esposti等人[″膜蛋白亲水性的关键评价″(1990)Eur J Biochem 190:207-219]的统计研究的算法,扫描了所有6个读码框中的核苷酸序列,以预测疏水性结构域的存在。这些结构域代表潜在的跨膜区域或疏水性前导序列。
用ORFFINDER程序(NCBI)从片段化的核苷酸序列预测开放读框。
有下划线的氨基酸序列代表用PSORT算法(http://www.psort.nibb.acjp)估测出的ORF中可能的跨膜区域或前导序列。还用MOTIFS程序(GCG Wisconsin和PROSITE)预测了功能性结构域。
可用各种试验来评价实施例中鉴定的蛋白的体内免疫原性。例如,可以重组方式表达这些蛋白质,并用于免疫印迹筛选患者血清。蛋白和患者血清之间发生阳性反应表明该患者以前已经建立了对该所述蛋白的免疫应答,即该蛋白是免疫原。该方法还可用来鉴定免疫优势蛋白。
重组蛋白还可方便地用来例如在小鼠中制备抗体。这些抗体可用来直接确认蛋白位于细胞表面。将标记的抗体(例如对于FACS为荧光标记)与完整的细菌培育,细菌表面出现标记确认了该蛋白的位置。
具体地说,采用下列方法(A)至(S),来表达、纯化和分析本发明蛋白的生物化学特性:
A)染色体DNA制备
使脑膜炎奈瑟氏球菌2996菌株在100毫升GC培养基中生长至指数期,离心收获,重悬于5毫升缓冲液(20%蔗糖、50毫摩尔Tris-HCl、50毫摩尔EDTA、pH8)中。冰上培育10分钟后,加入10毫升裂解溶液(50毫摩尔NaCl,1%Na-十二烷基肌氨酸钠,50微克/毫升蛋白酶K)裂解该细菌,37℃培育悬液2小时。用苯酚抽提两次(平衡至pH8),用三氯甲烷/异戊醇(24∶1)抽提一次。加入0.3M乙酸钠和2体积乙醇,使DNA沉淀,离心收集。用70%乙醇洗涤沉淀一次,重新溶解在4毫升缓冲液(10毫摩尔Tris-HCl,1毫摩尔EDTA,pH8)中。读取260纳米下OD值,测定DNA浓度。
B)寡核苷酸设计
用(a)脑膜炎球菌B的序列(当能获得时),或(b)淋球菌/脑膜炎球菌A序列(按需适应于脑膜炎球菌密码子偏好利用率),根据各ORF的编码序列,设计合成的寡核苷酸引物。推导紧靠预计的前导序列下游5′端扩增引物序列,忽略任何预计的信号肽。
5′引物包括两个限制性酶识别位点(BamHI-NdeI,BamHI-NheI或EcoRI-NheI,这取决于基因自身的限制性方式);3′引物包括一个XhoI限制性位点。建立该步骤是为了指导各扩增产物(对应于各ORF)克隆到以下两个不同的表达系统中:pGEX-KG(用BamHI-XhoI或EcoRI-XhoI),以及pET21b+(用NdeI-XhoI或NheI-XhoI)。
5’-端引物尾序列:  CGC GGATCCCATATG       (BamHI-NdeI)
                    CGC GGATCCGCTAGC       (BamHI-NheI)
                    CCG GAATTCTA GCTAGC   (EcoRI-NheI)
3’-端引物尾序列:  CCCG CTCGAG            (XhoI)
引物不仅含有限制性酶识别序列,而且还包括与待扩增序列杂交的核苷酸。杂交核苷酸的数目取决于整个引物的解链温度,对于各引物可用下式测定:
Tm=4(G+C)+2(A+T)                          (扫除尾部)
Tm=64.9+0.41(%GC)-600/N                  (整个引物)
对于整个寡核苷酸来说,所选寡核苷酸的平均解链温度为65-70℃,对于单单杂交区来说,平均解链温度为50-55℃。
表1显示了用于每一次扩增的正向和反向引物。用Perkin Elmer 394 DNA/RNA合成仪合成寡核苷酸,用2毫升氢氧化铵从柱上洗脱下,56℃培育5小时去保护。加入0.3M乙酸钠和2体积乙醇,使寡核苷酸沉淀。然后离心样品,将沉淀重悬于100微升或1毫升水中。用Perkin ElmerλBio分光光度计测定OD260,测得浓度,调节至2-10pmol/微升。
C)扩增
标准的PCR程序如下:在20-40微摩尔各寡核苷酸、400-800微摩尔dNTP溶液、1×PCR缓冲液(包括1.5毫摩尔氯化镁)、2.5单位TaqI DNA聚合酶(用Perkin-ElmerAmpliTaQ,GIBCO Platinum,Pwo DNA聚合酶或Tahara Shuzo Taq聚合酶)存在下,用50-200ng基因组DNA作为模板。
在一些例子中,通过加入10微升DMSO或50微升2M甜菜碱来优化PCR。
加热开始后(在95℃初步培育整个混合物3分钟期间加入聚合酶),每个样品经历两个步骤的扩增:开头5轮的进行用排除限制性酶尾部的寡核苷酸的解链温度作为杂交温度,随后的30轮根据全长寡核苷酸的杂交温度来进行。这些轮后是最后在72℃下延伸10分钟。
标准循环如下:
    变性     杂交     延伸
    前5轮     30秒95℃     30秒50-55℃     30-60秒72℃
    后30轮     30秒95℃     30秒65-70℃     30-60秒72℃
延伸时间随待扩增ORF的长度不同而不同。
扩增用9600或2400 Perkin Elmer GeneAmp PCR系统进行。为了检查结果,将1/10的扩增体积装载到1-1.5%琼脂糖凝胶上,将各扩增片段的大小与DNA分子量标记作比较。
将扩增的DNA直接上样到1%琼脂糖凝胶上,或是先用乙醇沉淀,然后重悬于合适的体积中,上样到1%琼脂糖凝胶上。然后用Qiagen凝胶抽提试剂盒按照生产商说明从凝胶中洗脱并纯化获得对应于大小正确条带的DNA片段。该DNA片段的最终体积为30微升或50微升的水,或10毫摩尔Tris,pH8.5。
D)PCR片段的消化
将对应于扩增片段的纯化的DNA分成2等份,用以下物质进行双重消化:
-NdeI/XhoI或NheI/XhoI,用于克隆到pET-21b+中,该蛋白进一步表达成C-端His-尾融合物
-BamHI/XhoI或EcoRI/XhoI,用于克隆到pGEX-KG中,该蛋白进一步表达成N-端GST融合物
-EcoRI/PstI,EcoRI/SalI,SalI/PstI,用于克隆到pGex-His中,该蛋白进一步表达成N-端His-尾融合物
在合适的缓冲液存在下,使各纯化DNA片段与20单位的各种限制性酶(NewEngland Biolabs)在30或40微升的最终体积中培育(37℃培育3小时至过夜)。然后用QIAquick PCR纯化试剂盒按照生产商说明书纯化消化产物,洗脱到最终体积为30微升或50微升的水中或10毫摩尔Tris-HCl(pH8.5)中。在滴定的分子量标记存在下,通过1%琼脂糖凝胶电泳测定最终的DNA浓度。
E)克隆载体(pET22B,pGEX-KG,pTRC-His A和pGex-His)的消化
在合适的缓冲液存在下,使200微升反应体积中的限制性酶各50单位与10微克质粒37℃培育过夜,对10微克质粒进行双消化。在将全部消化物上样到1%琼脂糖凝胶上后,用Qiagen QIAquick凝胶抽提试剂盒从凝胶中纯化对应于消化载体的条带,将DNA洗脱到50微升10毫摩尔Tris-HCl,pH8.5中。测定样品的OD260,评价其DNA浓度,并调节至50微克/微升。每个克隆步骤采用1微升质粒。
pGEX-His载体是经修饰的pGEX-2T载体,其在凝血酶断裂位点上游携带有一个编码6个组氨酸残基的区域,而且还含有载体pTRC99(Pharmacia)的多个克隆位点。
F)克隆
将预先消化和纯化的对应于各ORF的片段连接到pET22b和pGEX-KG中。在20微升的最终体积中,在生产商提供的缓冲液存在下,用0.5微升NEB T4 DNA连接酶(400单位/微升)连接摩尔比为3∶1的片段/载体。室温培育反应3小时。在一些实验中,用Boehringer的″快速连接试剂盒″按照生产商说明书进行连接。
为了将重组质粒导入合适的菌株内,使100微升大肠杆菌DH5感受态细胞与连接酶反应溶液于冰上培育40分钟,然后37℃3分钟,加入800微升LB肉汤后,再37℃培育20分钟。然后在Eppendorf微量离心机中以最大速度离心细胞,重悬于约200微升上清液中。然后将悬液接种到LB氨苄青霉素(100毫克/毫升)平板上。
使5个随机选择的菌落在2毫升(pGEX或pTC克隆)或5毫升(pET克隆)LB肉汤+100微克/毫升氨苄青霉素中37℃生长过夜,对重组克隆进行筛选。然后,使细胞沉淀,用Qiagen QIAprep旋转微量制备试剂盒,按照生产商说明书,将DNA抽提到最终体积为30微升。用NdeI/XhoI或BamHI/XhoI消化5微升各个微量制备物(约1微克),将整个消化物上样到1-1.5%琼脂糖凝胶上(取决于预计的插入物大小),与分子量标记(1Kb DNA梯序列,GIBCO)平行。根据正确的插入物大小筛选出阳性克隆。
G)表达
将克隆到表达载体中的每个ORF转化入适合表达重组蛋白产物的菌株中。用1微升各构建物转化上述30微升大肠杆菌BL21(pGEX载体)、大肠杆菌TOP10(pTRC载体)或大肠杆菌BL21-DE3(pET载体)。在pGEX-His载体例子中,用相同的大肠杆菌菌株(W3110)进行最初的克隆和表达。将单个重组菌落接种到2毫升LB+Amp(100微克/毫升)中,37℃培育过夜,然后1∶30稀释在100毫升瓶中的20毫升LB+Amp(100微克/毫升)中,确保OD600在0.1至0.15之间。将瓶培育在30℃回转水浴摇床中,直至OD表明达到适合诱导表达的指数生长(pET和pTRC载体的OD为0.4-0.8;pGEX和pGEX-His载体的OD为0.8-1)。对于pET,pTRC和pGEX-His载体,加入1毫摩尔IPTG,诱导蛋白质表达,而在pGEX系统情况下,IPTG的最终浓度为0.2毫摩尔。30℃培育3小时后,测OD检查样品的最终浓度。为了检查表达,取出各样品1毫升,在微量离心机中离心,将沉淀重悬于PBS中,用12%SDS-PAGE和考马斯蓝染色分析。6000g离心整个样品,将沉淀重悬于PBS中待用。
H)GST-融合蛋白大规模纯化
使单菌落在LB+Amp琼脂板上37℃培育过夜。将细菌接种到水浴摇床中20毫升LB+Amp培养液中,生长过夜。将细菌1∶30稀释到600毫升新鲜培养基中,使其在最适温度(20-37℃)下生长至OD550为0.8-1。用0.2毫摩尔IPTG诱导蛋白质表达,然后培育3小时。4℃、8000rpm离心培养物。弃去上清液,将细菌沉淀重悬于7.5毫升冷的PBS中。用Branson超声波仪B-15在冰上40W超声破碎细胞30秒种,冻融2次,再次离心。收集上清液,与150微升谷胱苷肽-Sepharose 4B树脂(Pharmacia)(先用PBS洗涤)混合,室温培育30分钟。4℃、700g离心样品5分钟。用10毫升冷的PBS洗涤树脂2次10分钟,重悬于1毫升冷PBS中,上样于一次性柱中。用2毫升冷PBS洗柱2次,直至流穿液OD280达到0.02-0.06。加入700微升冷的谷胱苷肽洗脱缓冲液(10毫摩尔还原的谷胱苷肽,50毫摩尔Tris-HCl),洗脱GST-融合蛋白,收集组分直至OD280为0.1。将各组分2 1微升上样于12%SDS凝胶上,凝胶采用BioradSDS-PAGE分子量标准宽范围(M1)(200,116.25,97.4,66.2,45,31,21.5,14.4,6.5kDa)或Amersham Rainbow标记(M2)(220,66,46,30,21.5,14.3kDa)作为标准。因为GST的MW为26kDa,因此该值必须加入各GST-融合蛋白的MW中。
I)His-融合物溶解度分析
为了分析His-融合物表达产物的溶解度,将3毫升培养物沉淀重悬于缓冲液M1[500微升PBS,pH7.2]中。加入25微升溶菌酶(10毫克/毫升),4℃培育细菌15分钟。用Branson超声仪B-15以40W超声破碎沉淀30秒,冻融两次,然后再次离心分离成沉淀和上清液。收集上清液,将沉淀重悬于缓冲液M2[8M尿素,0.5M氯化钠,20毫摩尔咪唑和0.1M磷酸二氢钠]中,4℃培育3-4小时。离心后,收集上清液,将沉淀重悬于缓冲液M3[6M盐酸胍,0.SM氯化钠,20毫摩尔咪唑和0.1M磷酸二氢钠]中,4℃过夜。用SDS-PAGE分析所有步骤的上清液。
J)His融合物大规模纯化
使单菌落在LB+Amp琼脂板上37℃培育过夜。将细菌接种到20毫升LB+Amp培养液中,在水浴摇床中培育过夜。将细菌1∶30稀释到600毫升新鲜培养基中,使其在最适温度(20-37℃)下生长至OD550为0.6-0.8。加入1毫摩尔IPTG诱导蛋白质表达,进一步培育该培养物3小时。4℃、8000rpm离心培养物,弃去上清液,将细菌沉淀重悬于7.5毫升(i)冷的缓冲液A(300毫摩尔氯化钠,50毫摩尔磷酸缓冲液,10毫摩尔咪唑,pH8,针对可溶性蛋白)或(ii)缓冲液B(尿素8M,10毫摩尔Tris-HCl,100毫摩尔磷酸缓冲液,pH8.8,针对不溶性蛋白)。
用Brason超声波仪B-15于40W在冰上超声破碎细胞30秒种,冻融2次,再次离心。
对于不溶性蛋白,-20℃保藏上清液,而将沉淀重悬于2毫升缓冲液C(6M盐酸胍,100毫摩尔磷酸缓冲液,10毫摩尔Tris-HCl,pH7.5)中,在匀化器中处理10个循环。13000rpm离心产物40分钟。
收集上清液,与150微升Ni2+ -树脂(Pharmacia)(先用合适的缓冲液A或缓冲液B洗涤),室温下轻微搅动培育30分钟。4℃,700g离心样品5分钟。用10毫升缓冲液A或B洗涤树脂二次10分钟,重悬于1毫升缓冲液A或B中,上样于一次性柱中。用2毫升冷的缓冲液A4℃洗涤树脂,或在室温下用2毫升缓冲液B洗涤树脂,直至流穿液OD280达到0.02-0.06。
用以下缓冲液洗涤树脂:(i)2毫升冷的20毫摩尔咪唑缓冲液(300毫摩尔氯化钠,50毫摩尔磷酸缓冲液,20毫摩尔咪唑,pH8)或(ii)缓冲液D(尿素8M,10毫摩尔Tris-HCl,100毫摩尔磷酸缓冲液,pH6.3),直至流穿液OD280达到0.02-0.06。加入700微升的(i)冷的洗脱缓冲液A(300毫摩尔氯化钠,50毫摩尔磷酸缓冲液,250毫摩尔咪唑,pH8)或(ii)洗脱缓冲液B(尿素8M,10毫摩尔Tris-HCl,100毫摩尔磷酸缓冲液,pH4.5),洗脱His-融合蛋白,收集组分直至OD280为0.1。将各组分21微升上样于12%SDS凝胶中。
K)His-融合蛋白复性
在变性的蛋白中加入10%甘油。然后用透析缓冲液I(10%甘油,0.5M精氨酸,50毫摩尔磷酸缓冲液,5毫摩尔还原的谷胱苷肽,0.5毫摩尔氧化的谷胱苷肽,2M尿素,pH8.8)将蛋白质稀释至20微克/毫升,用相同的缓冲液4℃透析12-14小时。用透析缓冲液II(10%甘油,0.5M精氨酸,50mM磷酸缓冲液,5毫摩尔还原的谷胱苷肽,0.5毫摩尔氧化的谷胱苷肽,pH8.8)进一步4℃透析蛋白质12-14小时。用下式评价蛋白浓度:
蛋白质(毫克/毫升)=(1.55×OD280)-(0.76×OD260)
L)His-融合物大规模纯化
用上述步骤诱导500毫升细菌培养物,获得可溶于缓冲液M1、M2或M3的融合蛋白。将细菌粗提物上样于Ni-NTA superflow柱(Quiagen),根据融合蛋白的溶解缓冲液,用缓冲液M1、M2或M3预先平衡该柱。用相同缓冲液洗柱,洗脱未结合的物质。用含有500毫摩尔咪唑的相应缓冲液洗脱特异性蛋白,用不含咪唑的相应缓冲液透析。每一轮后,在下次使用前用至少两个柱体积的0.5M氢氧化钠洗涤,对柱进行清洁,并重新平衡。
M)小鼠免疫
用各纯化蛋白20微克腹膜内免疫小鼠。在ORF44的情况下,用氢氧化铝作为佐剂,在第1、21和42天免疫CD1小鼠,监测第56天所取样品中的免疫应答。对于ORF 40,用Freund佐剂,而不是氢氧化铝,免疫CD1小鼠,采用相同的免疫方案,只是在第42天而非56天测定免疫应答。同样,对于ORF38,用Freund佐剂免疫CD1小鼠,但是在第49天测定免疫应答。
N)ELISA试验(血清分析)
将无荚膜MenB M7菌株接种到巧克力琼脂板上,37℃培育过夜。用无菌挑菌拭子收集琼脂板的细菌菌落,接种到7毫升含0.25%葡萄糖的Mueller-Hinton肉汤(Difco)中。跟踪OD620每30分钟监测细菌生长。使细菌长至OD达到0.3-0.4。10000rpm离心培养物10分钟。弃去上清液,用PBS洗涤细菌1次,重悬于含0.025%甲醛的PBS中,室温培育2小时,然后4℃搅拌过夜。在96孔Greiner板的每个孔中加入100微升细菌细胞,4℃培育过夜。然后用PBT洗涤缓冲液(0.1%吐温-20,PBS配)洗涤孔三次。每个孔中加入200微升饱和缓冲液(含2.7%聚乙烯吡咯烷酮10的水),37℃培育平板2小时。用PBT洗涤各孔3次。每个孔中加入200微升稀释的血清(稀释缓冲液:1%BSA,0.1%吐温-20,0.1%叠氮钠,PBS配),37℃培育平板90分钟。用PBT洗孔三次。在每个孔中加入100微升以稀释缓冲液1∶2000稀释的HRP-偶联的家兔抗小鼠(Dako)血清,37℃培育平板90分钟。用PBT缓冲液洗涤孔三次。在每个孔中加入100微升HRP的底物缓冲液(25毫升柠檬酸缓冲液pH5,10毫克邻苯二胺和10微升水),使平板在室温下放置20分钟。在每个孔中加入100微升硫酸,并跟踪OD490。当OD490为各自免疫前血清OD值的2.5倍时,认为ELISA呈阳性。
O)FACScan细菌结合试验程序
将无荚膜MenB M7菌株接种到巧克力琼脂板上,37℃培育过夜。用无菌挑菌拭子收集琼脂板上的细菌菌落,接种到8毫升含0.25%葡萄糖的Mueller-Hinton肉汤(Difco)的4个试管中。跟踪OD620,每30分钟监测细菌生长。使细菌长至OD达到0.35-0.5。4000rpm离心培养物10分钟。弃去上清液,将沉淀重悬于封闭缓冲液(1%BSA,0.4%叠氮钠)中,4000rpm离心5分钟。将细胞重悬于封闭缓冲液中,至OD620为0.07。在Costar 96孔板的每个孔中加入100微升细菌细胞。在每个孔中加入100微升稀释(1∶200)血清(封闭缓冲液配),4℃培育平板2小时。4000rpm离心细胞5分钟,吸出上清液,每个孔中加入200微升封闭缓冲液,洗涤细胞。在每个孔中加入1∶100稀释的R-Phicoerytrin偶联的F(ab)2山羊抗小鼠抗体,4℃培育平板1小时。4000rpm离心5分钟,使细胞旋转沉淀,在每个孔中加入200微升封闭缓冲液进行洗涤。吸出上清液,将细胞重悬于每孔200微升PBS和0.25%甲醛中。将样品转移到FACScan管中读数。FACScan设置的条件为:FL1,开,FL2和FL3关;FSC-H临界值:92;FSC PMT电压:E 02;SSC PMT:474;Amp.Gains 7.1;FL-2 PMT:539;补偿值:0。
P)OMV制备
使细菌在5GC平板上生长过夜,用挑菌环收获,重悬于10毫升20毫摩尔Tris-HCl中。56℃热灭活30分钟,在冰上超声破碎该细菌10分钟(50%负载循环,50%输出)。5000g离心10分钟,除去未破碎的细胞,4℃、50000g离心75分钟,回收全部细胞包膜组分。为了从粗制的外膜中抽提出细胞质膜蛋白,将全部组分重悬于2%十二烷基肌氨酸钠(Sigma)中,室温培育20分钟。10000g离心该悬浮液10分钟,除去凝聚物,对上清液进一步50000g超离心75分钟,使外膜沉淀。将外膜重悬于10毫摩尔Tris-HCl,pH8,用BioRad蛋白质试验以BSA为标准品测定蛋白浓度。
Q)全抽提物制备
使细菌在GC板上生长过夜,用挑菌环收获,重悬于1毫升20毫摩尔Tris-HCl中。56℃热灭活30分钟。
R)Western印迹
将MenB菌株2996的纯化蛋白(每条泳道500ng)、外膜泡囊(5微克)和全细胞抽提物(25微克)上样于15%SDS-PAGE中并转移到硝酸纤维素膜上。转移在4℃、150mA、转移缓冲液(0.3%Tris碱,1.44%甘氨酸,20%甲醇)中进行2小时。在饱和缓冲液(10%脱脂乳、0.1%Triton X100,PBS配)中4℃培育过夜,使该膜饱和。用洗涤缓冲液(3%脱脂乳,0.1%Triton X100,PBS配)洗涤该膜两次,并与洗涤缓冲液1∶200稀释的小鼠血清37℃培育2小时。洗涤该膜两次,和稀释度为1∶2000的辣根过氧化物酶标记的抗小鼠Ig培育90分钟。用含0.1%Triton X100的PBS洗涤该膜两次,用Opti-4CN底物试剂盒(Bio-Rad)显影。加入水,终止反应。
S)杀菌试验
使MC58菌株在巧克力琼脂板上37℃生长过夜。收集5-7个菌落,用于接种7毫升Mueller-Hinton肉汤。在章动器上37℃培育该悬浮液,使其生长至OD620为0.5-0.8。将培养液等分到1.5毫升无菌Eppendorf管中,在微量离心机中以最大速度离心20分钟。以Gey′s缓冲液(Gibco)洗涤沉淀一次,重悬于相同缓冲液中,至OD620为0.5,以Gey′s缓冲液稀释1∶20000,25℃保藏。
在96孔组织培养板的每个孔中加入50微升Gey′s缓冲液/1%BSA。在每个孔中加入25微升稀释的小鼠血清(1∶100稀释在Gey′s缓冲液/0.2%BSA中),4℃培育平板。将25微升前述细菌悬浮液加入每个孔中。每个孔中加入25微升热灭活(56℃水浴30分钟)或正常的幼兔补体。在加入幼兔补体后,立即将每个孔中22微升的样品接种到Mueller-Hinton琼脂板(时间0)。37℃转动培育96孔板1小时,然后将每个孔内22微升的样品接种到Mueller-Hinton琼脂板(时间1)上。过夜培育后,计数对应于时间0和时间1的菌落。
表II给出了克隆、表达和纯化结果的小结。
实施例1
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 1>:
1   ..ACACTGTTGT TTGCAACGGT TCAGGCAAG T GCTAACCAAT GAAGAGCAAG
51    AAGAAGATTT ATATTTAGAC CCCGTACAAC GCACTGTTGC CGTGTTGATA
101   GTCAATTCCG ATAAAGAAGG CACGGGAGAA AAAGAAAAAG TAGAAGAAAA
151   TTCAGATTGG GCAGTATATT TCAACGAGAA AGGAGTACTA ACAGCCAGAG
201   AAATCACCyT CAAAGCCGGC GACAACCTGA AAATCAAACA AAACGGCACA
251   AACTTCACCT ACTCGCTGAA AAAAGACCTC AcAGATCTGA CCAGTGTTGG
301   AACTGAAAAA TTATCGTTTA GCGCAAACGG CAATAAAGTC AACATcACAA
351   GCGACACCAA AGGCTTGAAT TTTGCGAAAG AAACGGCTGG sACGAACGgC
401   GACACCACGG TTCATCTGAA CGGTATTGGT TCGACTTTGA CCGATACGCT
451   GCTGAATACC GGAGCGACCA CAAACGTAAC CAACGACAAC GTTACCGATG
501   ACGAGAAAAA ACGTGCGGCA AGCGTTAAAG ACGTATTAAA CGCTGGCTGG
551   AACATTAAAG GCGTTAAACC CGGTACAACA GCTTCCGATA ACGTTGATTT
601   CGTCCGCACT TACGACACAG TCGAGTTCTT GAGCGCAGAT ACGAAAACAA
651   CGACTGTTAA TGTGGAAAGC AAAGACAACG GCAAGAAAAC CGAAGTTAAA
701   ATCGGTGCGA AGACTTCTGT TATTAAAGAA AAAGAC...
它对应于氨基酸序列<SEQ ID 2;ORF40>:
1   ..TLLFATVQAS ANQEEQEEDL YLDPVQRTVA VLIVNSDKEG TGEKEKVEEN
51    SDWAVYFNEK GVLTAREITX KAGDNLKIKQ NGTNFTYSLK KDLTDLTSVG
101   TEKLSFSANG NKVNITSDTK GLNFAKETAG TNGDTTVHLN GIGSTLTDTL
151   LNTGATTNVT NDNVTDDEKK RAASVKDVLN AGWNIKGVKP GTTASDNVDF
201   VRTYDTVEFL SADTKTTTVN VESKDNGKKT EVKIGAKTSV IKEKD...
进一步的工作揭示了完整的DNA序列<SEQ ID 3>:
1     ATGAACAAAA TATACCGCAT CATTTGGAAT AGTGCCCTCA ATGCCTGGGT
51    CGTCGTATCC GAGCTCACAC GCAACCACAC CAAACGCGCC TCCGCAACCG
101   TGAAGACCGC CGTATTGGCG ACACTGTTGT TTGCAACGGT TCAGGCAAGT
151   GCTAACAATG AAGAGCAAGA AGAAGATTTA TATTTAGACC CCGTACAACG
201   CACTGTTGCC GTGTTGATAG TCAATTCCGA TAAAGAAGGC ACGGGAGAAA
251   AAGAAAAAGT AGAAGAAAAT TCAGATTGGG CAGTATATTT CAACGAGAAA
301   GGAGTACTAA CAGCCAGAGA AATCACCCTC AAAGCCGGCG ACAACCTGAA
351   AATCAAACAA AACGGCACAA ACTTCACCTA CTCGCTGAAA AAAGACCTCA
401   CAGATCTGAC CAGTGTTGGA ACTGAAAAAT TATCGTTTAG CGCAAACGGC
451   AATAAAGTCA ACATCACAAG CGACACCAAA GGCTTGAATT TTGCGAAAGA
501   AACGGCTGGG ACGAACGGCG ACACCACGGT TCATCTGAAC GGTATTGGTT
551   CGACTTTGAC CGATACGCTG CTGAATACCG GAGCGACCAC AAACGTAACC
601   AACGACAACG TTACCGATGA CGAGAAAAAA CGTGCGGCAA GCGTTAAAGA
651   CGTATTAAAC GCTGGCTGGA ACATTAAAGG CGTTAAACCC GGTACAACAG
701   CTTCCGATAA CGTTGATTTC GTCCGCACTT ACGACACAGT CGAGTTCTTG
751   AGCGCAGATA CGAAAACAAC GACTGTTAAT GTGGAAAGCA AAGACAACGG
801   CAAGAAAACC GAAGTTAAAA TCGGTGCGAA GACTTCTGTT ATTAAAGAAA
851   AAGACGGTAA GTTGGTTACT GGTAAAGACA AAGGCGAGAA TGGTTCTTCT
901   ACAGACGAAG GCGAAGGCTT AGTGACTGCA AAAGAAGTGA TTGATGCAGT
951   AAACAAGGCT GGTTGGAGAA TGAAAACAAC AACCGCTAAT GGTCAAACAG
1001  GTCAAGCTGA CAAGTTTGAA ACCGTTACAT CAGGCACAAA TGTAACCTTT
1051  GCTAGTGGTA AAGGTACAAC TGCGACTGTA AGTAAAGATG ATCAAGGCAA
1101  CATCACTGTT ATGTATGATG TAAATGTCGG CGATGCCCTA AACGTCAATC
1151  AGCTGCAAAA CAGCGGTTGG AATTTGGATT CCAAAGCGGT TGCAGGTTCT
1201  TCGGGCAAAG TCATCAGCGG CAATGTTTCG CCGAGCAAGG GAAAGATGGA
1251  TGAAACCGTC AACATTAATG CCGGCAACAA CATCGAGATT ACCCGCAACG
1301  GTAAAAATAT CGACATCGCC ACTTCGATGA CCCCGCAGTT TTCCAGCGTT
1351  TCGCTCGGCG CGGGGGCGGA TGCGCCCACT TTGAGCGTGG ATGGGGACGC
1401  ATTGAATGTC GGCAGCAAGA AGGACAACAA ACCCGTCCGC ATTACCAATG
1451  TCGCCCCGGG CGTTAAAGAG GGGGATGTTA CAAACGTCGC ACAACTTAAA
1501  GGCGTGGCGC AAAACTTGAA CAACCGCATC GACAATGTGG ACGGCAACGC
1551  GCGTGCGGGC ATCGCCCAAG CGATTGCAAC CGCAGGTCTG GTTCAGGCGT
1601  ATTTGCCCGG CAAGAGTATG ATGGCGATCG GCGGCGGCAC TTATCGCGGC
1651  GAAGCCGGTT ACGCCATCGG CTACTCCAGT ATTTCCGACG GCGGAAATTG
1701  GATTATCAAA GGCACGGCTT CCGGCAATTC GCGCGGCCAT TTCGGTGCTT
1751  CCGCATCTGT CGGTTATCAG TGGTAA
它对应于氨基酸序列<SEQ ID 4;ORF40-1>:
1     MNKIYRIIWN SALNAWVVVS ELTRNHTKRA SATVKTAVLA TLLFATVQAS
51    ANNEEQEEDL YLDPVQRTVA VLIVNSDKEG TGEKEKVEEN SDWAVYFNEK
101   GVLTAREIrL KAGDNLKIKQ NGTNFTYSLK KDLTDLTSVG TEKLSFSANG
151   NKVNITSDTK GLNFAKETAG TNGDTTVHLN GIGSTLTDTL LNTGATTNVT
201   NDNVTDDEKK RAASVKDVLN AGWNIKGVKP GTTASDNVDF VRTYDTVEFL
251   SADTKTTTVN VESKDNGKKT EVKIGAKTSV IKEKDGKLVT GKDKGENGSS
301   TDEGEGLVTA KEVIDAVNKA GWRMKTTTAN GQTGQADKFE TVTSGTNVTF
351   ASGKGTTATV SKDDQGNITV MYDVNVGDAL NVNQLQNSGW NLDSKAVAGS
401   SGKVISGNVS PSKGKMDETV NINAGNNIEI TRNGKNIDIA TSMTPQFSSV
451   SLGAGADAPT LSVDGDALNV GSKKDNKPVR ITNVAPGVKE GDVTNVAQLK
501   GVAQNLNNRI DNVDGNARAG IAQAIATAGL VQAYLPGKSM MAIGGGTYRG
551   EAGYAIGYSS ISDGGNWIIK GTASGNSRGH FGASASVGYQ W*
进一步的工作鉴定了脑膜炎奈瑟氏球菌菌株A中对应的基因<SEQ ID 5>:
1     ATGAACAAAA TATACCGCAT CATTTGGAAT AGTGCCCTCA ATGCCTGNGT
51    CGCCGTATCC GAGCTCACAC GCAACCACAC CAAACGCGCC TCCGCAACCG
101   TGAAGACCGC CGTATTGGCG ACACTGTTGT TTGCAACGGT TCAGGCGAAT
151   GCTACCGATG AAGATGAAGA AGAAGAGTTA GAATCCGTAC AACGCTCTGT
201   CGTAGGGAGC ATTCAAGCCA GTATGGAAGG CAGCGGCGAA TTGGAAACGA
251   TATCATTATC AATGACTAAC GACAGCAAGG AATTTGTAGA CCCATACATA
301   GTAGTTACCC TCAAAGCCGG CGACAACCTG AAAATCAAAC AAAACACCAA
351   TGAAAACACC AATGCCAGTA GCTTCACCTA CTCGCTGAAA AAAGACCTCA
401   CAGGCCTGAT CAATGTTGAN ACTGAAAAAT TATCGTTTGG CGCAAACGGC
451   AAGAAAGTCA ACATCATAAG CGACACCAAA GGCTTGAATT TCGCGAAAGA
501   AACGGCTGGG ACGAACGGCG ACACCACGGT TCATCTGAAC GGTATCGGTT
551   CGACTTTGAC CGATACGCTT GCGGGTTCTT CTGCTTCTCA CGTTGATGCG
601   GGTAACCNAA GTACACATTA CACTCGTGCA GCAAGTATTA AGGATGTGTT
651   GAATGCGGGT TGGAATATTA AGGGTGTTAA ANNNGGCTCA ACAACTGGTC
701   AATCAGAAAA TGTCGATTTC GTCCGCACTT ACGACACAGT CGAGTTCTTG
751   AGCGCAGATA CGNAAACAAC GACNGTTAAT GTGGAAAGCA AAGACAACGG
801   CAAGAGAACC GAAGTTAAAA TCGGTGCGAA GACTTCTGTT ATTAAAGAAA
851   AAGACGGTAA GTTGGTTACT GGTAAAGGCA AAGGCGAGAA TGGTTCTTCT
901   ACAGACGAAG GCGAAGGCTT AGTGACTGCA AAAGAAGTGA TTGATGCAGT
951   AAACAAGGCT GGTTGGAGAA TGAAAACAAC AACCGCTAAT GGTCAAACAG
1001  GTCAAGCTGA CAAGTTTGAA ACCGTTACAT CAGGCACAAA TGTAACCTTT
1051  GCTAGTGGTA AAGGTACAAC TGCGACTGTA AGTAAAGATG ATCAAGGCAA
1101  CATCACTGTT ATGTATGATG TAAATGTCGG CGATGCCCTA AACGTCAATC
1151  AGCTGCAAAA CAGCGGTTGG AATTTGGATT CCAAAGCGGT TGCAGGTTCT
1201  TCGGGCAAAG TCATCAGCGG CAATGTTTCG CCGAGCAAGG GAAAGATGGA
1251  TGAAACCGTC AACATTAATG CCGGCAACAA CATCGAGATT AGCCGCAACG
1301  GTAAAAATAT CGACATCGCC ACTTCGATGG CGCCGCAGTT TTCCAGCGTT
1351  TCGCTCGGCG CGGGGGCAGA TGCGCCCACT TTAAGCGTGG ATGACGAGGG
1401  CGCGTTGAAT GTCGGCAGCA AGGATGCCAA CAAACCCGTC CGCATTACCA
1451  ATGTCGCCCC GGGCGTTAAA GANGGGGATG TTACAAACGT CNCACAACTT
1501  AAAGGCGTGG CGCAAAACTT GAACAACCGC ATCGACAATG TGGACGGCAA
1551  CGCGCGTGCN GGCATCGCCC AAGCGATTGC AACCGCAGGT CTGGTTCAGG
1601  CGTATCTGCC CGGCAAGAGT ATGATGGCGA TCGGCGGCGG CACTTATCGC
1651  GGCGAAGCCG GTTACGCCAT CGGCTACTCC AGTATTTCCG ACGGCGGAAA
1701  TTGGATTATC AAAGGCACGG CTTCCGGCAA TTCGCGCGGC CATTTCGGTG
1751  CTTCCGCATC TGTCGGTTAT CAGTGGTAA
它编码的蛋白质具有氨基酸序列<SEQ ID 6;ORF40a>:
1     MNKIYRIIWN SALNAXVAVS ELTRNHTKRA SATVKTAVLA TLLFATVQAN
51    ATDEDEEEEL ESVQRSVVGS IQASMEGSGE LETISLSMTN DSKEFVDPYI
101   VVTLKAGDNL KIKQNTNENT NASSFTYSLK KDLTGLINVX TEKLSFGANG
151   KKVNIISDTK GLNFAKETAG TNGDTTVHLN GIGSTLTDTL AGSSASHVDA
201   GNXSTHYTRA ASIKDVLNAG WNIKGVKXGS TTGQSENVDF VRTYDTVEFL
251   SADTXTTTVN VESKDNGKRT EVKIGAKTSV IKEKDGKLVT GKGKGENGSS
301   TDEGEGLVTA KEVIDAVNKA GWRMKTTTAN GQTGQADKFE TVTSGTNVTF
351   ASGKGTTATV SKDDQGNITV MYDVNVGDAL NVNQLQNSGW NLDSKAVAGS
401   SGKVISGNVS PSKGKMDETV NINAGNNIEI SRNGKNIDIA TSMAPQFSSV
451   SLGAGADAPT LSVDDEGALN VGSKDANKPV RITNVAPGVK XGDVTNVXQL
501   KGVAQNLNNR IDNVDGNARA GIAQAIATAG LVQAYLPGKS MMAIGGGTYR
551   GEAGYAIGYS SISDGGNNII KGTASGNSRG HFGASASVGY QW*
最初鉴定的部分菌株B序列(ORF40)显示在与ORF40a重叠的254个氨基酸内有65.7%的相同性:
                                                10        20        30
orf40.pep                               TLLFATVQASANQEEQEEDLYLDPVQRTVA
                                        |||||||||:|::|::||:|  : |||:|
orf40a    SALNAXVAVSELTRNHTKRASATVKTAVLATLLFATVQANATDEDEEEEL--ESVQRSV-
                  20        30        40        50        60
                 40         50        60        70        80
orf40.pep VLIVNSDKEGTGEKEKVEEN-SDWAVYFNEKGVLTAREITXKAGDNLKIKQN------GT
          |  :::: ||:|| | :  : :: :  | :  ::    :| |||||||||||      ::
orf40a    VGSIQASMEGSGELETISLSMTNDSKEFVDPYIV----VTLKAGDNLKIKQNTNENTNAS
           70        80        90       100           110       120
              90        100       110       120       130       140
orf40.pep NFTYSLKKDLTDLTSVGTEKLSFSANGNKVNITSDTKGLNFAKETAGTNGDTTVHLNGIG
          :|||||||||| | :| ||||||:|||:|||| |||||||||||||||||||||||||||
orf40a    SFTYSLKKDLTGLINVXTEKLSFGANGKKVNIISDTKGLNFAKETAGTNGDTTVHLNGIG
              130       140       150       160       170       180
              150       160       170       180       190        200
orf40.pep STLTDTLLNTGATTNVTNDNVTDDEKKRAASVKDVLNAGWNIKGVKPGTTA--SDNVDFV
          ||||||| :::|: :|   | :  :||||:|||||||||||||||| :|:|  |:|||||
orf40a    STLTDTLAGSSAS-HVDAGNXST-HYTRAASIKDVLNAGWNIKGVKXGSTTGQSENVDFV
              190        200        210       220       230       240
               210        220       230       240
orf40.pep RTYDTVEFLSADTKTTTVNVESKDNGKKTEVKIGAKTSVIKEKD
          ||||||||||||| |||||||||||||:||||||||||||||||
orf40a    RTYDTVEFLSADTXTTTVNVESKDNGKRTEVKIGAKTSVIKEKDGKLVTGKGKGENGSST
                250       260       270       280       290       300
完整的菌株B序列(ORF40-1)和ORF40a显示在601个重叠的氨基酸内有83.7%的相同性:
                       10        20        30        40        50        60
orf40-1.pep    MNKIYRIIWNSALNAWVVVSELTRNHTKRASATVKTAVLATLLFATVQASANNEEQEEDL
               ||||||||||||||| |:|||||||||||||||||||||||||||||||:|::|::||:|
orf40a         MNKIYRIIWNSALNAXVAVSELTRNHTKRASATVKTAVLATLLFATVQANATDEDEEEEL
                       10        20        30        40        50        60
                       70        80        90        100       110       119
orf40-1.pep    YLDPVQRTVAVLIVNSDKEGTGEKEKVEEN-SDWAVYFNEKGVLTAREITLKAGDNLKIK
                 : |||:| |  :::: ||:|| | :  : :: :  | :  ::    :|||||||||||
orf40a         --ESVQRSV-VGSIQASMEGSGELETISLSMTNDSKEFVDPYIV----VTLKAGDNLKIK
                          70        80        90       100           110
              120            130       140       150       160       170
orf40-1.pep    QN------GTNFTYSLKKDLTDLTSVGTEKLSFSANGNKVNITSDTKGLNFAKETAGTNG
               ||      :::|||||||||| |: | ||||||:|||:|||| |||||||||||||||||
orf40a         QNTNENTNASSFTYSLKKDLTGLINVXTEKLSFGANGKKVNIISDTKGLNFAKETAGTNG
                   120       130       140       150       160       170
                   180       190       200       210       220       230
orf40-1.pep    DTTVHLNGIGSTLTDTLLNTGATTNVTNDNVTDDEKKRAASVKDVLNAGWNIKGVKPGTT
               ||||||||||||||||| :::|: :|   |:   :||||:|||||||||||||||| |:|
orf40a         DTTVHLNGIGSTLTDTLAGSSAS-HVDAGNXST-HYTRAASIKDVLNAGWNIKGVKXGST
                   180       190        200        210       220       230
                    240       250        260       270       280       290
orf40-1.pep    A--SDNVDFVRTYDTVEFLSADTKTTTVNVESKDNGKKTEVKIGAKTSVIKEKDGKLVTG
               :  |:|||||||||||||||||| |||||||||||||:||||||||||||||||||||||
orf40a         TGQSENVDFVRTYDTVEFLSADTXTTTVNVESKDNGKRTEVKIGAKTSVIKEKDGKLVTG
                     240       250       260       270       280       290
                     300       310       320       330       340       350
orf40-1.pep    KDKGENGSSTDEGEGLVTAKEVIDAVNKAGWRMKTTTANGQTGQADKFETVTSGTNVTFA
               | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf40a         KGKGENGSSTDEGEGLVTAKEVIDAVNKAGWRMKTTTANGQTGQADKFETVTSGTNVTFA
                     300       310       320       330       340       350
                     360       370       380       390       400       410
orf40-1.pep    SGKGTTATVSKDDQGNITVMYDVNVGDALNVNQLQNSGWNLDSKAVAGSSGKVISGNVSP
               ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf40a         SGKGTTATVSKDDQGNITVMYDVNVGDALNVNQLQNSGWNLDSKAVAGSSGKVISGNVSP
                     360       370       380       390       400       410
                     420       430       440       450       460       470
orf40-1.pep    SKGKMDETVNINAGNNIEITRNGKNIDIATSMTPQFSSVSLGAGADAPTLSVDGD-ALNV
               |||||||||||||||||||:|||||||||||:||||||||||||||||||||| : ||||
orf40a         SKGKMDETVNINAGNNIEISRNGKNIDIATSMAPQFSSVSLGAGADAPTLSVDDEGALNV
                     420       430       440       450       460       470
                      480       490       500       510       520       530
orf40-1.pep    GSKKDNKPVRITNVAPGVKEGDVTNVAQLKGVAQNLNNRIDNVDGNARAGIAQAIATAGL
               |||  |||||||||||||| |||||| |||||||||||||||||||||||||||||||||
orf40a         GSKDANKPVRITNVAPGVKXGDVTNVXQLKGVAQNLNNRIDNVDGNARAGIAQAIATAGL
                     480       490       500       510       520       530
                      540       550       560       570       580       590
orf40-1.pep    VQAYLPGKSMMAIGGGTYRGEAGYAIGYSSISDGGNWIIKGTASGNSRGHFGASASVGYQ
               ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf40a         VQAYLPGKSMMAIGGGTYRGEAGYAIGYSSISDGGNWIIKGTASGNSRGHFGASASVGYQ
                     540       550       560       570       580       590
orf40-1.pep    WX
          ||
orf40a    WX
这些氨基酸序列的计算机分析给出了下列结果:
与流感嗜血菌的b型表面原纤维基因座编码的Hsf蛋白(登录号U41852)的同源
ORF40和Hsf蛋白显示在251个重叠的氨基酸内有54%的氨基酸相同性:
0rf40 1    TLLFATVQASANQEEQEEDLYLDPVQRTVAVLIVNSDXXXXXXXXXXXXNSDWAVYFNEK 60
           TLLFATVQA+A  E++E    LDPV RT  VL  +SD            NS+W +YF +K
Hsf    41  TLLFATVQANATDEDEE----LDPVVRTAPVLSFHSDKEGTGEKEVTE-NSNWGIYFDNK 95
0rf40  61  GVLTAREITXKAGDNLKIKQN------GTNFTYSLKKDLTDLTSVGTEKLSFSANGNKVN 114
           GVL A  IT KAGDNLKIKQN       ++FTYSLKKDLTDLTSV TEKLSF ANG+KV+
Hsf    96  GVLKAGAITLKAGDNLKIKQNTDESTNASSFTYSLKKDLTDLTSVATEKLSFGANGDKVD 155
0rf40  115 ITSDTKGLNFAKETAGTNGDTTVHLNGIGSTLTDTLLNTGAXXXXXXXXXXXXEKKRAAS 174
           ITSD  GL  AK      G+  VHLNG+ STL D + NTG             EK RAA+
Hsf    156 ITSDANGLKLAK-----TGNGNVHLNGLDSTLPDAVTNTGVLSSSSFTPNDV-EKTRAAT 209
0rf40  175 VKDVLNAGWNIKGVKPGTTASDNVDFVRTYDTVEFLSADTKTTTVNVESKDNGKKTEVKI 234
           VKDVLNAGWNIKG K      ++VD V  Y+ VEF++ D  T  V + +K+NGK TEVK
Hsf    210 VKDVLNAGWNIKGAKTAGGNVESVDLVSAYNNVEFITGDKNTLDVVLTAKENGKTTEVKF 269
0rf40  235 GAKTSVIKEKD 245
             KTSVIKEKD
Hsf    270 TPKTSVIKEKD 280
ORF40a还显示与Hsf同源:
gi|1666683(U41852)hsf基因产物[流感嗜血菌]长度=2353
评分=153(67.7bits),预计=1.5e-116,Sum P(11)=1.5e-116
相同性=33/36(91%),阳性=34/36(94%)
询问:     16 VAVSELTRNHTKRASATVKTAVLATLLFATVQANAT 51
               V VSELTR HTKRASATV+TAVLATLLFATVQANAT
目标:     17 VVVSELTRTHTKRASATVETAVLATLLFATVQANAT 52
评分=161(71.2bits),预计=1.5e-116,SumP(11)=1.5e-116
相同性=32/38(84%),阳性=36/38(94%)
询问:101 VTLKAGDNLKIKQNTNENTNASSFTYSLKKDLTGLINV 138
           +TLKAGDNLKIKQNT+E+TNASSFTYSLKKDLT L+V
目标:103 ITLKAGDNLKIKQNTDESTNASSFTYSLKKDLTDLTSV 140
评分=110(48.7bits),预计=1.5e-116,Sum P(11)=1.5e-116
相同性=21/29(72%),阳性=25/29(86%)
询问:138 VTEKLSFGANGKKVNIISDTKGLNFAKET 166
           V++KLS G NG KVNI SDTKGLNFAK++
目标:1439 VSDKLSLGTNGNKVNITSDTKGLNFAKDS 1467
评分=85(37.6bits),预计=1.5e-116,Sum P(11)=1.5e-116
相同性=18/32(56%),阳性=20/32(62%)
询问:169 TNGDTTVHLNGIGSTLTDTLAGSSASHVDAGN 200
           T D   +HLNGI STLTDTL  S A+   GN
目标:1469 TGDDANIHLNGIASTLTDTLLNSGATTNLGGN 1500
评分=92(40.7bits),预计=1.5e-116,Sum P(11)=1.5e-116
相同性=16/19(84%),阳性=19/19(100%)
询问:206 RAASIKDVLNAGWNIKGVK 224
           RAAS+KDVLNAGWN++GVK
目标:1509 RAASVKDVLNAGWNVRGVK 1527
评分=90(39.8bits),预计=1.5e-116,Sum P(11)=1.5e-116
相同性=17/28(60%),阳性=20/28(71%)
询问:226 STTGQSENVDFVRTYDTVEFLSADTTTT 253
           S   Q EN+DFV TYDTV+F+S D TT
目标:1530 SANNQVENIDFVATYDTVDFVSGDKDTT 1557
根据与Hsf的同源性,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
如上所述,将ORF40-1(61kDa)克隆到pET和pGex载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图1A显示了His-融合蛋白的亲和纯化结果,图1B显示了GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠,用该小鼠的血清进行FACS分析(图1C),杀菌试验(图1D)和ELISA(阳性结果)。这些实验确认ORF40-1是一种表面外露蛋白,且是一种有用的免疫原。
图1E显示了ORF40-1的亲水性曲线、抗原性指数和AMPHI区域。
实施例2
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 7>
1    ATGTTACGTt TGACTGCtTT AGCCGTATGC ACCGCCCTCG CTTTGGGCGC
51   GTGTTCGCCG CAAAATTCCG ACTCTGCCCC ACAAGCCAAA GaACAGGCGG
101  TTTCCGCCGC ACAAACCGAA GgCGCGTCCG TTACCGTCAA AACCGCGCGC
151  GGCGACGTTC AAATACCGCA AAACCCCGAA CGCATCGCCG TTTACGATTT
201  GGGTATGCTC GACACCTTGA GCAAACTGGG CGTGAAAACC GGTTTGTCCG
251  TCGATAAAAA CCGCCTGCCG TATTTAGAGG AATATTTCAA AACGACAAAA
301  CCTGCCGGCA CTTTGTTCGA GCCGGATTAC GAAACGCTCA ACGCTTACAA
351  ACCGCAGCTC ATCATCATCG GCAGCCGCGC CgCCAAGGCG TTTGACAAAT
401  TGAAcGAAAT CGCGCCGACC ATCGrmwTGA CCGCCGATAC CGCCAACCTC
451  AAAGAAAGTG CCAArGAGGC ATCGACGCTG GCGCAAATCT TC..
它对应于氨基酸序列<SEQ ID 8;ORF38>:
1    MLRLTAL AVC TALALGACSP QNSDSAPQAK EQAVSAAQTE GASVTVKTAR
51   GDVQIPQNPE RIAVYDLGML DTLSKLGVKT GLSVDKNRLP YLEEYFKTTK
101  PAGTLFEPDY ETLNAYKPQL IIIGSRAAKA FDKLNEIAPT IXXTADTANL
151  KESAKEASTL AQIF..
进一步的工作揭示了完整的核苷酸序列<SEQ ID 9>:
1    ATGTTACGTT TGACTGCTTT AGCCGTATGC ACCGCCCTCG CTTTGGGCGC
51   GTGTTCGCCG CAAAATTCCG ACTCTGCCCC ACAAGCCAAA GAACAGGCGG
101  TTTCCGCCGC ACAAACCGAA GGCGCGTCCG TTACCGTCAA AACCGCGCGC
151  GGCGACGTTC AAATACCGCA AAACCCCGAA CGCATCGCCG TTTACGATTT
201  GGGTATGCTC GACACCTTGA GCAAACTGGG CGTGAAAACC GGTTTGTCCG
251  TCGATAAAAA CCGCCTGCCG TATTTAGAGG AATATTTCAA AACGACAAAA
301  CCTGCCGGCA CTTTGTTCGA GCCGGATTAC GAAACGCTCA ACGCTTACAA
351  ACCGCAGCTC ATCATCATCG GCAGCCGCGC CGCCAAGGCG TTTGACAAAT
401  TGAACGAAAT CGCGCCGACC ATCGAAATGA CCGCCGATAC CGCCAACCTC
451  AAAGAAAGTG CCAAAGAGCG CATCGACGCG CTGGCGCAAA TCTTCGGCAA
501  ACAGGCGGAA GCCGACAAGC TGAAGGCGGA AATCGACGCG TCTTTTGAAG
551  CCGCGAAAAC TGCCGCACAA GGTAAGGGCA AAGGTTTGGT GATTTTGGTC
601  AACGGCGGCA AGATGTCGGC TTTCGGCCCG TCTTCACGCT TGGGCGGCTG
651  GCTGCACAAA GACATCGGCG TTCCCGCTGT CGATGAATCA ATTAAAGAAG
701  GCAGCCACGG TCAGCCTATC AGCTTTGAAT ACCTGAAAGA GAAAAATCCC
751  GACTGGCTGT TTGTCCTTGA CCGAAGCGCG GCCATCGGCG AAGAGGGTCA
801  GGCGGCGAAA GACGTGTTGG ATAATCCGCT GGTTGCCGAA ACAACCGCTT
851  GGAAAAAAGG ACAGGTCGTG TACCTCGTTC CTGAAACTTA TTTGGCAGCC
901  GGTGGCGCGC AAGAGCTGCT GAATGCAAGC AAACAGGTTG CCGACGCTTT
951  TAACGCGGCA AAATAA
它对应于氨基酸序列<SEQ ID 10;ORF38-1>:
1    MLRLTALAVC TALALGACSP QNSDSAPQAK EQAVSAAQTE GASVTVKTAR
51   GDVQIPQNPE RIAVYDLGML DTLSKLGVKT GLSVDKNRLP YLEEYFKTTK
101  PAGTLFEPDY ETLNAYKPQL IIIGSRAAKA FDKLNEIAPT IEMTADTANL
151  KESAKERIDA LAQIFGKQAE ADKLKAEIDA SFEAAKTAAQ GKGKGLVILV
201  NGGKMSAFGP SSRLGGWLHK DIGVPAVDES IKEGSHGQPI SFEYLKEKNP
251  DWLFVLDRSA AIGEEGQAAK DVLDNPLVAE TTAWKKGQVV YLVPETYLAA
301  GGAQELLNAS KQVADAFNAA K*
该氨基酸序列的计算机分析揭示了一个推定的原核细胞膜脂蛋白脂质连接位点(下划线)。
进一步的工作鉴定了脑膜炎奈瑟氏球菌菌株A中对应的基因<SEQ ID 11>:
1    ATGTTACGTT TGACTGCTTT AGCCGTATGC ACCGCCCTCG CTTTGGGCGC
51   GTGTTCGCCG CAAAATTCCG ACTCTGCCCC ACAAGCCAAA GAACAGGCGG
101  TTTCCGCCGC ACAATCCGAA GGCGTGTCCG TTACCGTCAA AACGGCGCGC
151  GGCGATGTTC AAATACCGCA AAACCCCGAA CGTATCGCCG TTTACGATTT
201  GGGTATGCTC GACACCTTGA GCAAACTGGG CGTGAAAACC GGTTTGTCCG
251  TCGATAAAAA CCGCCTGCCG TATTTAGAGG AATATTTCAA AACGACAAAA
301  CCTGCCGGAA CTTTGTTCGA GCCGGATTAC GAAACGCTCA ACGCTTACAA
351  ACCGCAGCTC ATCATCATCG GCAGCCGCGC AGCCAAAGCG TTTGACAAAT
401  TGAACGAAAT CGCGCCGACC ATCGAAATGA CCGCCGATAC CGCCAACCTC
451  AAAGAAAGTG CCAAAGAGCG TATCGACGCG CTGGCGCAAA TCTTCGGCAA
501  AAAGGCGGAA GCCGACAAGC TGAAGGCGGA AATCGACGCG TCTTTTGAAG
551  CCGCGAAAAC TGCCGCGCAA GGCAAAGGCA AGGGTTTGGT GATTTTGGTC
601  AACGGCGGCA AGATGTCCGC CTTCGGCCCG TCTTCACGAC TGGGCGGCTG
651  GCTGCACAAA GACATCGGCG TTCCCGCTGT TGACGAAGCC ATCAAAGAAG
701  GCAGCCACGG TCAGCCTATC AGCTTTGAAT ACCTGAAAGA GAAAAATCCC
751  GACTGGCTGT TTGTCCTTGA CCGCAGCGCG GCCATCGGCG AAGAGGGTCA
801  GGCGGCGAAA GACGTGTTGA ACAATCCGCT GGTTGCCGAA ACAACCGCTT
851  GGAAAAAAGG ACAAGTCGTT TACCTTGTTC CTGAAACTTA TTTGGCAGCC
901  GGTGGCGCGC AAGAGCTACT GAATGCAAGC AAACAGGTTG CCGACGCTTT
951  TAACGCGGCA AAATAA
它编码的蛋白质具有氨基酸序列<SEQ ID 12;ORF38a>:
1    MLRLTALAVC TALALGACSP QNSDSAPQAK EQAVSAAQSE GVSVTVKTAR
51   GDVQIPQNPE RIAVYDLGML DTLSKLGVKT GLSVDKNRLP YLEEYFKTTK
101  PAGTLFEPDY ETLNAYKPQL IIIGSRAAKA FDKLNEIAPT IEMTADTANL
151  KESAKERIDA LAQIFGKKAE ADKLKAEIDA SFEAAKTAAQ GKGKGLVILV
201  NGGKMSAFGP SSRLGGWLHK DIGVPAVDEA IKEGSHGQPI SFEYLKEKNP
251  DWLFVLDRSA AIGEEGQAAK DVLNNPLVAE TTAWKKGQVV YLVPETYLAA
301  GGAQELLNAS KQVADAFNAA K*
最初鉴定的部分菌株B序列(ORF38)显示在和ORF38a重叠的165个氨基酸内有95.2%的相同性:
                     10        20        30        40        50        60
orf38.pep     MLRLTALAVCTALALGACSPQNSDSAPQAKEQAVSAAQTEGASVTVKTARGDVQIPQNPE
             |||||||||||||||||| ||||||||||||||||||||:||:||||||||||||||||||
orf38a        MLRLTALAVCTALALGACSPQNSDSAPQAKEQAVSAAQSEGVSVTVKTARGDVQIPQNPE
                     10        20        30        40        50        60
                     70        80        90        100       110       120
orf38.pep    RIAVYDLGMLDTLSKLGVKTGLSVDKNRLPYLEEYFKTTKPAGTLFEPDYETLNAYKPQL
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf38a       RIAVYDLGMLDTLSKLGVKTGLSVDKNRLPYLEEYFKTTKPAGTLFEPDYETLNAYKPQL
                     70        80        90       100       110       120
                    130       140       150        160
orf38.pep    IIIGSRAAKAFDKLNEIAPTIXXTADTANLKESAKE-ASTLAQIF
             |||||||||||||||||||||  |||||||||||||  ::|||||
orf38a       IIIGSRAAKAFDKLNEIAPTIEMTADTANLKESAKERIDALAQIFGKKAEADKLKAEIDA
                    130       140       150       160       170       180
orf38a       SFEAAKTAAQGKGKGLVILVNGGKMSAFGPSSRLGGWLHKDIGVPAVDEAIKEGSHGQPI
                    190       200       210       220       230       240
完整的菌株B序列(ORF38-1)和ORF38a显示在321个重叠的氨基酸内有98.4%的相同性:
orf38a.pep   MLRLTALAVCTALALGACSPQNSDSAPQAKEQAVSAAQSEGVSVTVKTARGDVQIPQNPE
             ||||||||||||||||||||||||||||||||||||||:||:||||||||||||||||||
orf38-1      MLRLTALAVCTALALGACSPQNSDSAPQAKEQAVSAAQTEGASVTVKTARGDVQIPQNPE
orf38a.pep   RIAVYDLGMLDTLSKLGVKTGLSVDKNRLPYLEEYFKTTKPAGTLFEPDYETLNAYKPQL
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf38-1      RIAVYDLGMLDTLSKLGVKTGLSVDKNRLPYLEEYFKTTKPAGTLFEPDYETLNAYKPQL
orf38a.pep   IIIGSRAAKAFDKLNEIAPTIEMTADTANLKESAKERIDALAQIFGKKAEADKLKAEIDA
             |||||||||||||||||||||||||||||||||||||||||||||||:||||||||||||
orf38-1      IIIGSRAAKAFDKLNEIAPTIEMTADTANLKESAKERIDALAQIFGKQAEADKLKAEIDA
orf38a.pep   SFEAAKTAAQGKGKGLVILVNGGKMSAFGPSSRLGGWLHKDIGVPAVDEAIKEGSHGQPI
             |||||||||||||||||||||||||||||||||||||||||||||||||:||||||||||
orf38-1      SFEAAKTAAQGKGKGLVILVNGGKMSAFGPSSRLGGWLHKDIGVPAVDESIKEGSHGQPI
orf38a.pep   SFEYLKEKNPDWLFVLDRSAAIGEEGQAAKDVLNNPLVAETTAWKKGQVVYLVPETYLAA
             |||||||||||||||||||||||||||||||||:||||||||||||||||||||||||||
orf38-1      SFEYLKEKNPDWLFVLDRSAAIGEEGQAAKDVLDNPLVAETTAWKKGQVVYLVPETYLAA
orf38a.pep   GGAQELLNASKQVADAFNAAK
             |||||||||||||||||||||
orf38-1      GGAQELLNASKQVADAFNAAK
这些序列的计算机分析揭示了下列结果:
与C.jejuni的脂蛋白(lipo)(登录号X82427)的同源性
ORF38和lipo显示在96个重叠的氨基酸内有38%的氨基酸相同性:
0rf38:40  EGASVTVKTARGDVQIPQNPERIAVYDLGMLDTLSKLGVKTGLS-VDKNRLPYLEEYFKT 98
           EG S  VK + G+ + P+NP ++ + DLG+LDT   L +   ++ V    LP  +  FK
Lipo:51   EGDSFLVKDSLGENKTPKNPSKVVILDLGILDTFDALKLNDKVAGVPAKNLPKYLQQFKN 110
0rf38:99  TKPAGTLFEPDYETLNAYKPQLIIIGSRAAKAFDKL 134
               G + + D+E +NA KP LIII R  +K +DKL
Lipo:111  KPSVGGVQQVDFEAINALKPDLIIISGRQSKFYDKL 146
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
如上所述,将ORF38-1(32kDa)克隆到pET和pGex载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图2A显示了His-融合蛋白的亲和纯化结果,图2B显示了GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠,将该小鼠的血清用于Western印迹分析(图2C)和FACS分析(图2D)。这些实验确认ORF38-1是一种表面外露蛋白,且是一种有用的免疫原。
图2E显示了ORF38-1的亲水性曲线、抗原性指数和AMPHI区域。
实施例3
鉴定出下列脑膜炎奈瑟氏球菌的DNA序列<SEQ ID 13>:
1    ATGAAACTTC TGACCACCGC AATCCTGTCT TCCGCAATCG CGCTCAGCAG
51   TATGGCTGCC GCCGCTGGCA CGGACAACCC CACTGTTGCA AAAAAAACCG
101  TCAGCTACGT CTGCCAGCAA GGTAAAAAAG TCAAAGTAAC CTACGGCTTC
151  AACAAACAGG GTCTGACCAC ATACGCTTCC GCCGTCATCA ACGGCAAACG
201  CGTGCAAATG CCTGTCAATT TGGACAAATC CGACAATGTG GAAACATTCT
251  ACGGCAAAGA AGGCGGTTAT GTTTTGGGTA CCGGCGTGAT GGATGGCAAA
301  TCCTACCGCA AACAGCCCAT TATGATTACC GCACCTGACA ACCAAATCGT
351  CTTCAAAGAC TGTTCCCCAC GTTAA
它对应于氨基酸序列<SEQ ID 14;ORF44>:
1    MKLLTTAILS SAIALSSMAA AAGTDNPTVA KKTVSYVCQQ GKKVKVTYGF
51   NKQGLTTYAS AVINGKRVQM PVNLDKSDNV ETFYGKEGGY VLGTGVMDGK
101  SYRKQPIMIT APDNQIVFKD CSPR*
该氨基酸序列的计算机分析预计了下划线所示的前导肽。
进一步的工作鉴定了脑膜炎奈瑟氏球菌菌株A中对应的基因<SEQ ID 15>:
1    ATGAAACTTC TGACCACCGC AATCCTGTCT TCCGCAATCG CGCTCAGCAG
51   TATGGCTGCT GCTGCCGGCA CGAACAACCC CACCGTTGCC AAAAAAACCG
101  TCAGCTACGT CTGCCAGCAA GGTAAAAAAG TCAAAGTAAC CTACGGCTTT
151  AACAAACAGG GCCTGACCAC ATACGCTTCC GCCGTCATCA ACGGCAAACG
201  TGTGCAAATG CCTGTCAATT TGGACAAATC CGACAATGTG GAAACATTCT
251  ACGGCAAAGA AGGCGGTTAT GTTTTGGGTA CCGGCGTGAT GGATGGCAAA
301  TCCTATCGCA AACAGCCTAT TATGATTACC GCACCTGACA ACCAAATCGT
351  CTTCAAAGAC TGTTCCCCAC GTTAA
它编码的蛋白质具有氨基酸序列<SEQ ID 16;ORF44a>:
1    MKLLTTAILS SAIALSSMAA AAGTNNPTVA KKTVSYVCQQ GKKVKVTYGF
51   NKQGLTTYAS AVINGKRVQM PVNLDKSDNV ETFYGKEGGY VLGTGVMDGK
101  SYRKQPIMIT APDNQIVFKD CSPR*
菌株B序列(ORF44)显示在与ORF44a重叠的124个氨基酸内有99.2%的相同性:
                   10        20        30        40        50        60
orf44.pep  MKLLTTAILSSAIALSSMAAAAGTDNPTVAKKTVSYVCQQGKKVKVTYGFNKQGLTTYAS
           ||||||||||||||||||| |||||:|||||||||||||||||||||||||||||||||||
orf44a     MKLLTTAILSSAIALSSMAAAAGTNNPTVAKKTVSYVCQQGKKVKVTYGFNKQGLTTYAS
                   10        20        30        40        50        60
                   70        80        90        100       110       120
orf44.pep  AVINGKRVQMPVNLDKSDNVETFYGKEGGYVLGTGVMDGKSYRKQPIMITAPDNQIVFKD
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf44a     AVINGKRVQMPVNLDKSDNVETFYGKEGGYVLGTGVMDGKSYRKQPIMITAPDNQIVFKD
                   70        80        90       100       110      120
orf44.pep  CSPRX
           |||||
orf44a     CSPRX
计算机分析给出下列结果:
与啮蚀拟杆菌(Eikenella corrodens)的LecA粘附素(登录号D78153)的同源性
ORF44和LecA蛋白显示在91个重叠的氨基酸内有45%的氨基酸相同性:
0rf44  33 TVSYVCQQGKKVKVTYGFNKQGLTTYASAVINGKRVQMPVNLDKSDNVETFYGKEGGYVL 92
          +V+YVCQQG+++ V Y FN  G+ T A   +N + +++P NL  SDNV+T +    GY L
LecA  135 SVAYVCQQGRRLNVNYRFNSAGVPTSAELRVNNRNLRLPYNLSASDNVDTVF-SANGYRL 193
0rf44 93  GTGVMDGKSYRKQPIMITAPDNQIVFKDCSP 123
           T MD   +YR Q I+++AP+ Q+++KDCSP
LecA 194  TTNAMDSANYRSQDI IVSAPNGQMLYKDCSP 224
根据与该粘附素的同源性,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
如上所述,将ORF44-1(11.2kDa)克隆到pET和pGex载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图3A显示了His-融合蛋白的亲和纯化结果,图3B显示了GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠,用该小鼠的血清进行ELISA,给出阳性结果,并将该血清用于杀菌试验(图3C)。这些实验确认ORF44-1是一种表面外露蛋白,且是一种有用的免疫原。
图3D显示了ORF44-1的亲水性曲线、抗原性指数和AMPHI区域。
实施例4
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 17>
1    ..GGCACCGAAT TCAAAACCAC CCTTTCCGGA GCCGACATAC AGGCAGGGGT
51     GGGTGAAAAA GCCCGAGCCG ATGCGAAAAT TATCCTAAAA GGCATCGTTA
101    ACCGCATCCA AACCGAAGAA AAGCTGGAAT CCAACTCGAC CGTATGGCAA
151    AAGCAGGCCG GAAGCGGCAG CACGGTTGAA ACGCTGAAGC TACCGAGCTT
201    TGAAGGGCCG GCACTGCCTA AGCTGACCGC TCCCGGCGGC TATATCGCCG
251    ACATCCCCAA AGGCAACCTC AAAACCGAAA TCGAAAAGCT GGCCAAACAG
301    CCCGAATATG CCTATCTGAA ACAGCTTCAG ACGGTCAAGG ACGTGAACTG
351    GAACCAAGTA CAGCTCGCTT ACGACAAATG GGACTATAAA CAGGAAGGCC
401    TAACCGGAGC CGGAGCCGCA ATTANCGCAC TGGCCGTTAC CGTGGTCACC
451    TCAGGCGCAG GAACCGGAGC CGTATTGGGA TTAANACGNG TGGCCGCCGC
501    CGCAACCGAT GCAGCATTT...
它对应于氨基酸序列<SEQ ID 18;ORF49>:
1    ..GTEFKTTLSG ADIQAGVGEK ARADAKIILK GIVNRIQTEE KLESNSTVWQ
51     KQAGSGSTVE TLKLPSFEGP ALPKLTAPGG YIADIPKGNL KTEIEKLAKQ
101    PEYAYLKQLQ TVKDVNWNQV QLAYDKWDYK QE GLTGAGAA IXALAVTVVT
151    SGAGTGAVLG LXRVAAAATD AAF..
进一步的工作揭示了完整的核苷酸序列<SEQ ID 19>:
1      ATGCAACTGC TGGCAGCCGA AGGCATTCAC CAACACCAAT TGAATGTTCA
51     GAAAAGTACC CGTTTCATCG GCATCAAAGT GGGTAAAAGC AATTACAGCA
101    AAAACGAGCT GAACGAAACC AAACTGCCCG TACGCGTTAT CGCCCAAACA
151    GCCAAAACCC GTTCCGGCTG GGATACCGTA CTCGAAGGCA CCGAATTCAA
201    AACCACCCTT TCCGGAGCCG ACATACAGGC AGGGGTGGGT GAAAAAGCCC
251    GAGCCGATGC GAAAATTATC CTAAAAGGCA TCGTTAACCG CATCCAAACC
301    GAAGAAAAGC TGGAATCCAA CTCGACCGTA TGGCAAAAGC AGGCCGGAAG
351    CGGCAGCACG GTTGAAACGC TGAAGCTACC GAGCTTTGAA GGGCCGGCAC
401    TGCCTAAGCT GACCGCTCCC GGCGGCTATA TCGCCGACAT CCCCAAAGGC
451    AACCTCAAAA CCGAAATCGA AAAGCTGGCC AAACAGCCCG AATATGCCTA
501    TCTGAAACAG CTTCAGACGG TCAAGGACGT GAACTGGAAC CAAGTACAGC
551  TCGCTTACGA CAAATGGGAC TATAAACAGG AAGGCCTAAC CGGAGCCGGA
601  GCCGCAATTA TCGCACTGGC CGTTACCGTG GTCACCTCAG GCGCAGGAAC
651  CGGAGCCGTA TTGGGATTAA ACGGTGCGGC CGCCGCCGCA ACCGATGCAG
701  CATTTGCCTC TTTGGCCAGC CAGGCTTCCG TATCGTTCAT CAACAACAAA
751  GGCAATATCG GTAACACCCT GAAAGAGCTG GGCAGAAGCA GCACGGTGAA
801  AAATCTGATG GTTGCCGTCG CTACCGCAGG CGTAGCCGAC AAAATCGGTG
851  CTTCGGCACT GAACAATGTC AGCGATAAGC AGTGGATCAA CAACCTGACC
901  GTCAACCTGG CCAATGCGGG CAGTGCCGCA CTGATTAATA CCGCTGTCAA
951  CGGCGGCAGC CTGAAAGACA ATCTGGAAGC GAATATCCTT GCGGCTTTGG
1001 TGAATACTGC GCATGGAGAG GCAGCAAGTA AAATCAAACA GTTGGATCAG
1051 CACTACATTG CCCATAAGAT TGCCCATGCC ATAGCGGGCT GTGCGGCAGC
1101 GGCGGCGAAT AAGGGCAAGT GTCAAGATGG TGCGATCGGT GCGGCGGTCG
1151 GTGAAATCCT TGGCGAAACC CTACTGGACG GCAGAGACCC TGGCAGCCTG
1201 AATGTGAAGG ACAGGGCAAA AATCATTGCT AAGGCGAAGC TGGCAGCAGG
1251 GGCGGTTGCG GCGTTGAGTA AGGGGGATGT GAGTACGGCG GCGAATGCGG
1301 CTGCTGTGGC GGTAGAGAAT AATTCTTTAA ATGATATACA GGATCGTTTG
1351 TTGAGTGGAA ATTATGCTTT ATGTATGAGT GCAGGAGGAG CAGAAAGCTT
1401 TTGTGAGTCT TATCGACCAC TGGGCTTGCC ACACTTTGTA AGTGTTTCAG
1451 GAGAAATGAA ATTACCTAAT AAATTCGGGA ATCGTATGGT TAATGGAAAA
1501 TTAATTATTA ACACTAGAAA TGGCAATGTA TATTTCTCTG TAGGTAAAAT
1551 ATGGAGTACT GTAAAATCAA CAAAATCAAA TATAAGTGGG GTATCTGTCG
1601 GTTGGGTTTT AAATGTTTCC CCTAATGATT ATTTAAAAGA AGCATCTATG
1651 AATGATTTCA GAAATAGTAA TCAAAATAAA GCCTATGCAG AAATGATTTC
1701 CCAGACTTTG GTAGGTGAGA GTGTTGGTGG TAGTCTTTGT CTGACAAGAG
1751 CCTGCTTTTC GGTAAGTTCA ACAATATCTA AATCTAAATC TCCTTTTAAA
1801 GATTCAAAAA TTATTGGGGA AATCGGTTTG GGAAGTGGTG TTGCTGCAGG
1851 AGTAGAAAAA ACAATATACA TAGGTAACAT AAAAGATATT GATAAATTTA
1901 TTAGTGCAAA CATAAAAAAA TAG
它对应于氨基酸序列<SEQ ID 20;ORF49-1>:
1    MQLLAAEGIH QHQLNVQKST RFIGIKVGKS NYSKNELNET KLPVRVIAQT
51   AKTRSGWDTV LEGTEFKTTL SGADIQAGVG EKARADAKII LKGIVNRIQT
101  EEKLESNSTV WQKQAGSGST VETLKLPSFE GPALPKLTAP GGYIADIPKG
151  NLKTEIEKLA KQPEYAYLKQ LQTVKDVNWN QVQLAYDKWD YKQEG LTGAG
201  AAIIALAVTV VTSGAGTGAV LGLNGAAAAA TDAAFASLAS QASVSFINNK
251  GNIGNTLKEL GRSSTVKNLM VAVATAGVAD KIGASALNNV SDKQWINNLT
301  VNLANAGSAA LINTAVNGGS LKDNLEANIL AALVNTAHGE AASKIKQLDQ
351  HYIAHKIAHA IAGCAAAAAN KGKCQDGAIG AAVGEILGET LLDGRDPGSL
401  NVKDRAKIIA KAKLAAGAVA ALSKGDVSTA ANAAAVAVEN NSLNDIQDRL
451  LSGNYALCMS AGGAESFCES YRPLGLPHFV SVSGEMKLPN KFGNRMVNGK
501  LIINTRNGNV YFSVGKIWST VKSTKSNISG VSVGWVLNVS PNDYLKEASM
551  NDFRNSNQNK AYAEMISQTL VGESVGGSLC LTRACFSVSS TISKSKSPFK
601  DSKIIGEIGL GSGVAAGVEK TIYIGNIKDI DKFISANIKK*
计算机分析预计了一个跨膜结构域,还表明ORF49与已知的蛋白质没有明显的氨基酸同源性。然而,鉴定出脑膜炎奈瑟氏球菌菌株A的相应ORF:
ORF49显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF49a)重叠的173个氨基酸内有86.1%的相同性:
                                                 10        20        30
orf49.pep                                GTEFKTTLSGADIQAGVGEKARADAKIILK
                                         ||||||||:|||||||| ||||:|||||||
orf49a     SKNELNETKLPVRVVAQXAATRSGWDTVLEGTEFKTTLAGADIQAGVXEKARVDAKIILK
                 40        50        60        70        80        90
                  40        50        60        70        80        90
orf49.pep  GIVNRIQTEEKLESNSTVWQKQAGSGSTVETLKLPSFEGPALPKLTAPGGYIADIPKGNL
           |||||||:|||||:|||||||||| |||:|||||||||:|: |||:||||||:|||||||
orf49a     GIVNRIQSEEKLETNSTVWQKQAGRGSTIETLKLPSFESPTPPKLSAPGGYIVDIPKGNL
                100       110       120       130       140       150
                    100       110       120       130       140       150
orf49.pep    KTEIEKLAKQPEYAYLKQLQTVKDVNWNQVQLAYDKWDYKQEG LTGAGAAIXALAVTVVT
             |||||||:||||||||||||::|::||||||||||:||||||| || ||||| ||||||||
orf49a       KTEIEKLSKQPEYAYLKQLQVAKNINWNQVQLAYDRWDYKQEG LTEAGAAIIALAVTVVT
                  160       170       180       190       200       210
                    160       170
orf49.pep    SGAGTGAVLGLXRVAAAATDAAF
             |||||||||||  : ||||||||
orf49a       SGAGTGAVLGLNGAXAAATDAAFASLASQASVSFINNKGDVGKTLKELGRSSTVKNLVVA
                  220       230       240       250       260       270
ORF49-1和ORF49a显示在457个重叠的氨基酸内有83.2%的相同性:
orf49a.pep   XQLLAEEGIHKHELDVQKSRRFIGIKVGXSNYSKNELNETKLPVRVVAQXAATRSGWDTV
              |||| ||||:|:|:|||| |||||||| |||||||||||||||||:||:| ||||||||
orf49-1      MQLLAAEGIHQHQLNVQKSTRFIGIKVGKSNYSKNELNETKLPVRVIAQTAKTRSGWDTV
orf49a.pep   LEGTEFKTTLAGADIQAGVXEKARVDAKIILKGIVNRIQSEEKLETNSTVWQKQAGRGST
             ||||||||||:|||||||| ||||:||||||||||||||:|||||:|||||||||| |||
orf49-1      LEGTEFKTTLSGADIQAGVGEKARADAKIILKGIVNRIQTEEKLESNSTVWQKQAGSGST
orf49a.pep   IETLKLPSFESPTPPKLSAPGGYIVDIPKGNLKTEIEKLSKQPEYAYLKQLQVAKNINWN
             :|||||||||:|: |||:||||||:||||||||||||||:||||||||||||::|::|||
orf49-1      VETLKLPSFEGPALPKLTAPGGYIADIPKGNLKTEIEKLAKQPEYAYLKQLQTVKDVNWN
orf49a.pep   QVQLAYDRWDYKQEGLTEAGAAIIALAVTVVTSGAGTGAVLGLNGAXAAATDAAFASLAS
             |||||||:||||||||| |||||||||||||||||||||||||||| |||||||||||||
orf49-1      QVQLAYDKWDYKQEGLTGAGAAIIALAVTVVTSGAGTGAVLGLNGAAAAATDAAFASLAS
orf49a.pep   QASVSFINNKGDVGKTLKELGRSSTVKNLVVAAATAGVADKIGASALXNVSDKQWINNLT
             |||||||||||::|:||||||||||||||:||:|||||||||||||| ||||||||||||
orf49-1      QASVSFINNKGNIGNTLKELGRSSTVKNLMVAVATAGVADKIGASALNNVSDKQWINNLT
orf49a.pep   VNLANAGSAALINTAVNGGSLKDXLEANILAALVNTAHGEAASKIKQLDQHYIVHKIAHA
             ||||||||||||||||||||||| |||||||||||||||||||||||||||||:||||||
orf49-1      VNLANAGSAALINTAVNGGSLKDNLEANILAALVNTAHGEAASKIKQLDQHYIAHKIAHA
orf49a.pep   IAGCAAAAANKGKCQDGAIGAAVGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVS
             ||||||||||||||||||||||||||:||:| :|::| :|::|:| :|:| :||:||:|:
orf49-1      IAGCAAAAANKGKCQDGAIGAAVGEILGETLLDGRDPGSLNVKDRAKIIAKAKLAAGAVA
orf49a.pep   GVVGGDVNAAANAAEVAVKNNQLSDXEGREFDNEMTACAKQNXPQLCRKNTVKKYQNVAD
             ::  |||::||||| |||:||:|:| : | :::::: |
orf49-1      ALSKGDVSTAANAAAVAVENNSLNDIQDRLLSGNYALCMSAGGAESFCESYRPLGLPHFV
orf49a.pep   KRLAASIAICTDISRSTECRTIRKQHLIDSRSLHSSWEAGLIGKDDEWYKLFSKSYTQAD
orf49-1      SVSGEMKLPNKFGNRMVNGKLIINTRNGNVYFSVGKIWSTVKSTKSNISGVSVGWVLNVS
全长ORF49a的核苷酸序列<SEQ ID 21>是:
1     NTGCAACTGC TGGCAGAAGA AGGCATCCAC AAGCACGAGT TGGATGTCCA
51    AAAAAGCCGC CGCTTTATCG GCATCAAGGT AGGTNAGAGC AATTACAGTA
101   AAAACGAACT GAACGAAACC AAATTGCCTG TCCGCGTCGT CGCCCAAANT
151   GCAGCCACCC GTTCAGGCTG GGATACCGTG CTCGAAGGTA CCGAATTCAA
201   AACCACGCTG GCCGGTGCCG ACATTCAGGC AGGTGTANGC GAAAAAGCCC
251   GTGTCGATGC GAAAATTATC CTCAAAGGCA TTGTGAACCG TATCCAGTCG
301   GAAGAAAAAT TAGAAACCAA CTCAACCGTA TGGCAGAAAC AGGCCGGACG
351   CGGCAGCACT ATCGAAACGC TAAAACTGCC CAGCTTCGAA AGCCCTACTC
401   CGCCCAAATT GTCCGCACCC GGCGGNTATA TCGTCGACAT TCCGAAAGGC
451   AATCTGAAAA CCGAAATCGA AAAGCTGTCC AAACAGCCCG AGTATGCCTA
501   TCTGAAACAG CTCCAAGTAG CGAAAAACAT CAACTGGAAT CAGGTGCAGC
551   TTGCTTACGA CAGATGGGAC TACAAACAGG AGGGCTTAAC CGAAGCAGGT
601   GCGGCGATTA TCGCACTGGC CGTTACCGTG GTCACCTCAG GCGCAGGAAC
651   CGGAGCCGTA TTGGGATTAA ACGGTGCGNC CGCCGCCGCA ACCGATGCAG
701   CATTCGCCTC TTTGGCCAGC CAGGCTTCCG TATCGTTCAT CAACAACAAA
751   GGCGATGTCG GCAAAACCCT GAAAGAGCTG GGCAGAAGCA GCACGGTGAA
801   AAATCTGGTG GTTGCCGCCG CTACCGCAGG CGTAGCCGAC AAAATCGGCG
851   CTTCGGCACT GANCAATGTC AGCGATAAGC AGTGGATCAA CAACCTGACC
901   GTCAACCTAG CCAATGCGGG CAGTGCCGCA CTGATTAATA CCGCTGTCAA
951   CGGCGGCAGC CTGAAAGACA NTCTGGAAGC GAATATCCTT GCGGCTTTGG
1001  TCAATACCGC GCATGGAGAA GCAGCCAGTA AAATCAAACA GTTGGATCAG
1051  CACTACATAG TCCACAAGAT TGCCCATGCC ATAGCGGGCT GTGCGGCAGC
1101  GGCGGCGAAT AAGGGCAAGT GTCAGGATGG TGCGATAGGT GCGGCTGTGG
1151  GCGAGATAGT CGGGGAGGCT TTGACAAACG GCAAAAATCC TGACACTTTG
1201  ACAGCTAAAG AACGCGAACA GATTTTGGCA TACAGCAAAC TGGTTGCCGG
1251  TACGGTAAGC GGTGTGGTCG GCGGCGATGT AAATGCGGCG GCGAATGCGG
1301  CTGAGGTAGC GGTGAAAAAT AATCAGCTTA GCGACNAAGA GGGTAGAGAA
1351  TTTGATAACG AAATGACTGC ATGCGCCAAA CAGAATANTC CTCAACTGTG
1401  CAGAAAAAAT ACTGTAAAAA AGTATCAAAA TGTTGCTGAT AAAAGACTTG
1451  CTGCTTCGAT TGCAATATGT ACGGATATAT CCCGTAGTAC TGAATGTAGA
1501  ACAATCAGAA AACAACATTT GATCGATAGT AGAAGCCTTC ATTCATCTTG
1551  GGAAGCAGGT CTAATTGGTA AAGATGATGA ATGGTATAAA TTATTCAGCA
1601  AATCTTACAC CCAAGCAGAT TTGGCTTTAC AGTCTTATCA TTTGAATACT
1651  GCTGCTAAAT CTTGGCTTCA ATCGGGCAAT ACAAAGCCTT TATCCGAATG
1701  GATGTCCGAC CAAGGTTATA CACTTATTTC AGGAGTTAAT CCTAGATTCA
1751  TTCCAATACC AAGAGGGTTT GTAAAACAAA ATACACCTAT TACTAATGTC
1801  AAATACCCGG AAGGCATCAG TTTCGATACA AACCTANAAA GACATCTGGC
1851  AAATGCTGAT GGTTTTAGTC AAGAACAGGG CATTAAAGGA GCCCATAACC
1901  GCACCAATNT TATGGCAGAA CTAAATTCAC GAGGAGGANG NGTAAAATCT
1951  GAAACCCANA CTGATATTGA AGGCATTACC CGAATTAAAT ATGAGATTCC
2001  TACACTAGAC AGGACAGGTA AACCTGATGG TGGATTTAAG GAAATTTCAA
2051  GTATAAAAAC TGTTTATAAT CCTAAAAANT TTTNNGATGA TAAAATACTT
2101  CAAATGGCTC AANATGCTGN TTCACAAGGA TATTCAAAAG CCTCTAAAAT
2151  TGCTCAAAAT GAAAGAACTA AATCAATATC GGAAAGAAAA AATGTCATTC
2201  AATTCTCAGA AACCTTTGAC GGAATCAAAT TTAGANNNTA TNTNGATGTA
2251  AATACAGGAA GAATTACAAA CATTCACCCA GAATAATTTA A
它编码的蛋白质具有氨基酸序列<SEQ ID 22>:
1    XQLLAEEGIH KHELDVQKSR RFIGIKVGXS NYSKNELNET KLPVRVVAQX
51   AATRSGWDTV LEGTEFKTTL AGADIQAGVX EKARVDAKII LKGIVNRIQS
101  EEKLETNSTV WQKQAGRGST IETLKLPSFE SPTPPKLSAP GGYIVDIPKG
151  NLKTEIEKLS KQPEYAYLKQ LQVAKNINWN QVQLAYDRWD YKQEG LTEAG
201  AAIIALAVTV VTSGAGTGAV LGLNGAXAAA TDAAFASLAS QASVSFINNK
251  GDVGKTLKEL GRSSTVKNLV VAAATAGVAD KIGASALXNV SDKQWINNLT
301  VNLANAGSAA LINTAVNGGS LKDXLEANIL AALVNTAHGE AASKIKQLDQ
351  HYIVHKIAHA IAGCAAAAAN KGKCQDGAIG AAVGEIVGEA LTNGKNPDTL
401  TAKEREQILA YSKLVAGTVS GVVGGDVNAA ANAAEVAVKN NQLSDXEGRE
451  FDNEMTACAK QNXPQLCRKN TVKKYQNVAD KRLAASIAIC TDISRSTECR
501  TIRKQHLIDS RSLHSSWEAG LIGKDDEWYK LFSKSYTQAD LALQSYHLNT
551  AAKSWLQSGN TKPLSEWMSD QGYTLISGVN PRFIPIPRGF VKQNTPITNV
601  KYPEGISFDT NLXRHLANAD GFSQEQGIKG AHNRTNXMAE LNSRGGXVKS
651  ETXTDIEGIT RIKYEIPTLD RTGKPDGGFK EISSIKTVYN PKXFXDDKIL
701  QMAQXAXSQG YSKASKIAQN ERTKSISERK NVIQFSETFD GIKFRXYXDV
751  NTGRITNIHP E*
根据推定跨膜结构域的存在,预计脑膜炎奈瑟氏球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原。
实施例5
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 23>
1    ..CGGATCGTTG TAGGTTTGCG GATTTCTTGC GCCGTAGTCA CCGTAGTCCC
51     AAGTATAACC CAAGGCTTTG TCTTCGCCTT TCATTCCGAT AAGGGATATG
101    ACGCTTTGGT CGGTATAGCC GTCTTGGGAA CCTTTGTCCA CCCAACGCAT
151    ATCTGCCTGC GGATTCTCAT TGCCGCTTCT TGGCTGCTGA TTTTTCTGCC
201    TTCGCGTTTT TCAACTTCGC GCTTGAGGGC TTCGGCATAT TTGTCGGCCA
251    ACGCCATTTC TTTCGGATGC AGCTGCCTAT TGTTCCAATC TACATTCGCA
301    CCCACCACAG CACCACCACT ACCACCAGTT GCATAG
它对应于氨基酸序列<SEQ ID 24;ORF50>:
1    ..R IVVGLRISC AVVTVVPSIT QGFVFAFHSD KGYDALVGIA VLGTFVHPTH
51     ICLRILIAAS WLLIFLPSRF STSRLRASAY LSANAISFGC SCLLFQSTFA
101    PTTAPPLPPV A*
计算机分析预计了两个跨膜结构域,并且还表明ORF50与已知蛋白质没有明显的氨基酸同源性。
根据推定跨膜结构域的存在,预计脑膜炎奈瑟氏球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原。
实施例6
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 25>
1    ..AAGTTTGACT TTACCTGGTT TATTCCGGCG GTAATCAAAT ACCGCCGGTT
51     GTTTTTTGAA GTATTGGTGG TGTCGGTGGT GTTGCAGCTG TTTGCGCTGA
101    TTACGCCTCT GTTTTTCCAA GTGGTGATGG ACAAGGTGCT GGTACATCGG
151    GGATTCTCTA CTTTGGATGT GGTGTCGGTG GCTTTGTTGG TGGTGTCGCT
201    GTTTGAGATT GTGTTGGGCG GTTTGCGGAC GTATCTGTTT GCACATACGA
251    CTTCACGTAT TGATGTGGAA TTGGGCGCGC GTTTGTTCCG GCATCTGCTT
301    TCCCTGCCTT TATCCTATTT CGAGCACAGA CGAGTGGGTG ATACGGTGGC
351    TCGGGTGCGG GAATTGGAGC AGATTCGCAA TTTCTTGACC GGTCAGGCGC
401    TGACTTCGGT GTTGGATTTG GCGTTTTCGT TTATCTTTCT GGCGGTGATG
451    TGGTATTACA GCTCCACTCT GACTTGGGTG GTATTGGCTT CGTTG.....
                                            //
1451   .......... .......... .......... .......... ..........
1501   .......... .......... .......... .......... ..ATTTGCGC
1551   CAACCGGACG GTGCTGATTA TCGCCCACCG TCTGTCCACT GTTAAAACGG
1601   CACACCGGAT CATTGCCATG GATAAAGGCA GGATTGTGGA AGCGGGAACA
1651   CAGCAGGAAT TGCTGGCGAA CG..AACGGA TATTACCGCT ATCTGTATGA
1701   TTTACAGAAC GGGTAG
它对应于氨基酸序列<SEQ ID 26;ORF39>:
1    ..KFLFTWFIPA VIKYRRLFFE VLVVSVVLQL FALITPLFFQ VVMDKVLVHR
51     GFSTLDVVSV ALLVVSLFEI VLGGLRTYLF AHTTSRIDVE LGARLFRHLL
101    SLPLSYFEHR RVGDTVARVR ELEQIRNFLT GQALTSVLDL AFSFIFLAVM
151    WYYSSTLTWV VLASL..... .......... .......... ..........
                                            //
501    .......... ....ICANRT VLIIAHRLST VKTAHRIIAM DKGRIVEAGT
551    QQELLANXNG YYRYLYDLQN G*
进一步的工作揭示了完整的核苷酸序列<SEQ ID 27>:
1    ATGTCTATCG TATCCGCACC GCTCCCCGCC CTTTCCGCCC TCATCATCCT
51   CGCCCATTAC CACGGCATTG CCGCCAATCC TGCCGATATA CAGCATGAAT
101  TTTGTACTTC CGCACAGAGC GATTTAAATG AAACGCAATG GCTGTTAGCC
151  GCCAAATCTT TGGGATTGAA GGCAAAGGTA GTCCGCCAGC CTATTAAACG
201  TTTGGCTATG GCGACTTTAC CCGCATTGGT ATGGTGTGAT GACGGCAACC
251  ATTTCATTTT GGCCAAAACA GACGGTGAGG GTGAGCATGC CCAATTTTTG
301  ATACAGGATT TGGTTACGAA TAAGTCTGCG GTATTGTCTT TTGCCGAATT
351  TTCTAACAGA TATTCGGGCA AACTGATATT GGTTGCTTCC CGCGCTTCGG
401  TATTGGGCAG TTTGGCAAAG TTTGACTTTA CCTGGTTTAT TCCGGCGGTA
451  ATCAAATACC GCCGGTTGTT TTTTGAAGTA TTGGTGGTGT CGGTGGTGTT
501  GCAGCTGTTT GCGCTGATTA CGCCTCTGTT TTTCCAAGTG GTGATGGACA
551  AGGTGCTGGT ACATCGGGGA TTCTCTACTT TGGATGTGGT GTCGGTGGCT
601  TTGTTGGTGG TGTCGCTGTT TGAGATTGTG TTGGGCGGTT TGCGGACGTA
651  TCTGTTTGCA CATACGACTT CACGTATTGA TGTGGAATTG GGCGCGCGTT
701  TGTTCCGGCA TCTGCTTTCC CTGCCTTTAT CCTATTTCGA GCACAGACGA
751  GTGGGTGATA CGGTGGCTCG GGTGCGGGAA TTGGAGCAGA TTCGCAATTT
801  CTTGACCGGT CAGGCGCTGA CTTCGGTGTT GGATTTGGCG TTTTCGTTTA
851  TCTTTCTGGC GGTGATGTGG TATTACAGCT CCACTCTGAC TTGGGTGGTA
901  TTGGCTTCGT TGCCTGCCTA TGCGTTTTGG TCGGCATTTA TCAGTCCGAT
951  ACTGCGGACG CGTCTGAACG ATAAGTTCGC GCGCAATGCA GACAACCAGT
1001 CGTTTTTAGT AGAAAGCATC ACTGCGGTGG GTACGGTAAA GGCGATGGCG
1051 GTGGAGCCGC AGATGACGCA GCGTTGGGAC AATCAGTTGG CGGCTTATGT
1101 GGCTTCGGGA TTTCGGGTAA CGAAGTTGGC GGTGGTCGGC CAGCAGGGGG
1151 TGCAGCTGAT TCAGAAGCTG GTGACGGTGG CGACGTTGTG GATTGGCGCA
1201 CGGCTGGTAA TTGAGAGCAA GCTGACGGTG GGGCAGCTGA TTGCGTTTAA
1251 TATGCTCTCG GGACAGGTGG CGGCGCCTGT TATCCGTTTG GCGCAGTTGT
1301 GGCAGGATTT CCAGCAGGTG GGGATTTCGG TGGCGCGTTT GGGGGATATT
1351 CTGAATGCGC CGACCGAGAA TGCGTCTTCG CATTTGGCTT TGCCCGATAT
1401 CCGGGGGGAG ATTACGTTCG AACATGTCGA TTTCCGCTAT AAGGCGGACG
1451 GCAGGCTGAT TTTGCAGGAT TTGAACCTGC GGATTCGGGC GGGGGAAGTG
1501 CTGGGGATTG TGGGACGTTC GGGGTCGGGC AAATCCACAC TCACCAAATT
1551 GGTGCAGCGT CTGTATGTAC CGGAGCAGGG ACGGGTGTTG GTGGACGGCA
1601 ACGATTTGGC TTTGGCCGCT CCTGCCTGGC TGCGGCGGCA GGTCGGCGTG
1651 GTCTTGCAGG AGAATGTGCT GCTCAACCGC AGCATACGCG ACAATATCGC
1701 GCTGACGGAT ACGGGTATGC CGCTGGAACG CATTATCGAA GCAGCCAAAC
1751 TGGCGGGCGC ACACGAGTTT ATTATGGAGC TGCCGGAAGG CTACGGCACC
1801 GTGGTGGGCG AACAAGGGGC CGGCTTGTCG GGCGGACAGC GGCAGCGTAT
1851 TGCGATTGCC CGCGCGTTAA TCACCAATCC GCGCATTCTG ATTTTTGATG
1901 AAGCCACCAG CGCGCTGGAT TATGAAAGTG AACGAGCGAT TATGCAGAAC
1951 ATGCAGGCCA TTTGCGCCAA CCGGACGGTG CTGATTATCG CCCACCGTCT
2001 GTCCACTGTT AAAACGGCAC ACCGGATCAT TGCCATGGAT AAAGGCAGGA
2051 TTGTGGAAGC GGGAACACAG CAGGAATTGC TGGCGAAGCC GAACGGATAT
2101 TACCGCTATC TGTATGATTT ACAGAACGGG TAG
它对应于氨基酸序列<SEQ ID 28;ORF39-1>:
1    MSIVSAPLPA LSALIILAHY HGIAANPADI QHEFCTSAQS DLNETQWLLA
51   AKSLGLKAKV VRQPIKRLAM ATLPALVWCD DGNHFILAKT DGEGEHAQFL
101  IQDLVTNKSA VLSFAEFSNR YSGKLILVAS RASVLGSLAK FDFTWFIPAV
151  IKYRRL FFEV LVVSVVLQLF ALITPLFFQV VMDKVLVHRG FSTLD VVSVA
201  LLVVSLFEIV LGGLRTYLFA HTTSRIDVEL GARLFRHLLS LPLSYFEHRR
251  VGDTVARVRE LEQIRNFLTG QA LTSVLDLA FSFIFLAVMW YYSSTLTW VV
301  LASLPAYAFW SAFISPILRT RLNDKFARNA DNQSFLVESI TAVGTVKAMA
351  VEPQMTQRWD NQLAAYVASG FRVTKLAVVG QQGVQLIQKL VTVATLWIGA
401  RLVIESKLTV GQLIAFNMLS GQVAAPVIRL AQLWQDFQQV GISVARLGDI
451  LNAPTENASS HLALPDIRGE ITFEHVDFRY KADGRLILQD LNLRIRAGEV
501  LGIVGRSGSG KSTLTKLVQR LYVPEQGRVL VDGNDLALAA PAWLRRQVGV
551  VLQENVLLNR SIRDNIALTD TGMPLERIIE AAKLAGAHEF IMELPEGYGT
601  VVGEQGAGLS GGQRQRIAIA RALITNPRIL IFDEATSALD YESERAIMQN
651  MQAICANRTV LIIAHRLSTV KTAHRIIAMD KGRIVEAGTQ QELLAKPNGY
701  YRYLYDLQNG*
该氨基酸序列的计算机分析给出了下列结果:
与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性
ORF39显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF39a)重叠的165个氨基酸内有100%的相同性:
                                                  10        20        30
orf39.pep                                  KFDFTWFIPAVIKYRRL FFEVLVVSVVLQL
                                           ||||||||||||||||| |||||||||||||
orf39a       AVLSFAEFSNRYSGKLILVASRASVLGSLAKFDFTWFIPAVIKYRRL FFEVLVVSVVLQL
           110       120       130       140       150       160
                     40        50        60        70        80        90
orf39.pep     FALITPLFFQVVMDKVLVHRGFSTLD VVSVALLVVSLFEIVLGGLRTYLFAHTTSRIDVE
              |||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||||||||
orf39a        FALITPLFFQVVMDKVLVHRGFSTLD VVSVALLVVSLFEIVLGGLRTYLFAHTTSRIDVE
           170       180       190       200       210       220
                    100       110       120       130       140       150
orf39.pep    LGARLFRHLLSLPLSYFEHRRVGDTVARVRELEQIRNFLTGQA LTSVLDLAFSFIFLAVM
             ||||||||||||||||||||||||||||||||||||||||||| |||||||||||||||||
orf39a       LGARLFRHLLSLPLSYFEHRRVGDTVARVRELEQIRNFLTGQA LTSVLDLAFSFIFLAVM
           230       240       250       260       270       280
                    160       170       180       190       200       210
orf39.pep    WYYSSTLTW VVLASLXXXXXXXXXXXXXXXXXXXXXXXXXXXXICANRTVLIIAHRLSTV
             ||||||||| ||||||
orf39a       WYYSSTLTW VVLASLPAYAFWSAFISPILRTRLNDKFARNADNQSFLVESITAVGTVKAM
           290       300       310       320       330       340
ORF39-1和ORF39a显示在710个重叠的氨基酸内有99.4%的相同性:
orf39-1.pep  MSIVSAPLPALSALIILAHYHGIAANPADIQHEFCTSAQSDLNETQWLLAAKSLGLKAKV
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf39a       MSIVSAPLPALSALIILAHYHGIAANPADIQHEFCTSAQSDLNETQWLLAAKSLGLKAKV
orf39-1.pep  VRQPIKRLAMATLPALVWCDDGNHFILAKTDGEGEHAQFLIQDLVTNKSAVLSFAEFSNR
             |||||||||||||||||||||||||||||||| |||||:|||||:|||||||||||||||
orf39a       VRQPIKRLAMATLPALVWCDDGNHFILAKTDGGGEHAQYLIQDLTTNKSAVLSFAEFSNR
orf39-1.pep  YSGKLILVASRASVLGSLAKFDFTWFIPAVIKYRRLFFEVLVVSVVLQLFALITPLFFQV
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf39a       YSGKLILVASRASVLGSLAKFDFTWFIPAVIKYRRLFFEVLVVSVVLQLFALITPLFFQV
orf39-1.pep  VMDKVLVHRGFSTLDVVSVALLVVSLFEIVLGGLRTYLFAHTTSRIDVELGARLFRHLLS
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf39a       VMDKVLVHRGFSTLDVVSVALLVVSLFEIVLGGLRTYLFAHTTSRIDVELGARLFRHLLS
orf39-1.pep  LPLSYFEHRRVGDTVARVRELEQIRNFLTGQALTSVLDLAFSFIFLAVMWYYSSTLTWVV
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf39a       LPLSYFEHRRVGDTVARVRELEQIRNFLTGQALTSVLDLAFSFIFLAVMWYYSSTLTWVV
orf39-1.pep  LASLPAYAFWSAFISPILRTRLNDKFARNADNQSFLVESITAVGTVKAMAVEPQMTQRWD
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf39a       LASLPAYAFWSAFISPILRTRLNDKFARNADNQSFLVESITAVGTVKAMAVEPQMTQRWD
orf39-1.pep  NQLAAYVASGFRVTKLAVVGQQGVQLIQKLVTVATLWIGARLVIESKLTVGQLIAFNMLS
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf39a       NQLAAYVASGFRVTKLAVVGQQGVQLIQKLVTVATLWIGARLVIESKLTVGQLIAFNMLS
orf39-1.pep  GQVAAPVIRLAQLWQDFQQVGISVARLGDILNAPTENASSHLALPDIRGEITFEHVDFRY
             |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| |
orf39a       GQVAAPVIRLAQLWQDFQQVGISVARLGDILNAPTENASSHLALPDIRGEITFEHVDFRY
orf39-1.pep  KADGRLILQDLNLRIRAGEVLGIVGRSGSGKSTLTKLVQRLYVPEQGRVLVDGNDLALAA
             |||||||||||||||||||||||||||||||||||||||||||| |||||||||||||||
orf39a       KADGRLILQDLNLRIRAGEVLGIVGRSGSGKSTLTKLVQRLYVPAQGRVLVDGNDLALAA
orf39-1.pep   PAWLRRQVGVVLQENVLLNRSIRDNIALTDTGMPLERIIEAAKLAGAHEFIMELPEGYGT
              ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf39a        PAWLRRQVGVVLQENVLLNRSIRDNIALTDTGMPLERIIEAAKLAGAHEFIMELPEGYGT
orf39-1.pep   VVGEQGAGLSGGQRQRIAIARALITNPRILIFDEATSALDYESERAIMQNMQAICANRTV
              ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf39a        VVGEQGAGLSGGQRQRIAIARALITNPRILIFDEATSALDYESERAIMQNMQAICANRTV
orf39-1.pep   LIIAHRLSTVKTAHRIIAMDKGRIVEAGTQQELLAKPNGYYRYLYDLQNGX
              |||||||||||||||||||||||||||||||||||||||||||||||||||
orf39a        LIIAHRLSTVKTAHRIIAMDKGRIVEAGTQQELLAKPNGYYRYLYDLQNGX
全长ORF39a的核苷酸序列<SEQ ID 29>是:
1    ATGTCTATCG TATCCGCACC GCTCCCCGCC CTTTCCGCCC TCATCATCCT
51   CGCCCATTAC CACGGCATTG CCGCCAATCC TGCCGATATA CAGCATGAAT
101  TTTGTACTTC CGCACAGAGC GATTTAAATG AAACGCAATG GCTGTTAGCC
151  GCCAAATCTT TGGGATTGAA GGCAAAGGTA GTCCGCCAGC CTATTAAACG
201  TTTGGCTATG GCGACTTTAC CCGCATTGGT ATGGTGTGAT GACGGCAACC
251  ATTTTATTTT GGCTAAAACA GACGGTGGGG GTGAGCATGC CCAATATCTA
301  ATACAGGATT TAACTACGAA TAAGTCTGCG GTATTGTCTT TTGCCGAATT
351  TTCTAACAGA TATTCGGGCA AACTGATATT GGTTGCTTCC CGCGCTTCGG
401  TATTGGGCAG TTTGGCAAAG TTTGACTTTA CCTGGTTTAT TCCGGCGGTA
451  ATCAAATACC GCCGGTTGTT TTTTGAAGTA TTGGTGGTGT CGGTGGTGTT
501  GCAGCTGTTT GCGCTGATTA CGCCTCTGTT TTTCCAAGTG GTGATGGACA
551  AGGTGCTGGT ACATCGGGGA TTCTCTACTT TGGATGTGGT GTCGGTGGCT
601  TTGTTGGTGG TGTCGCTGTT TGAGATTGTG TTGGGCGGTT TGCGGACGTA
651  TCTGTTTGCA CATACGACTT CACGTATTGA TGTGGAATTG GGCGCGCGTT
701  TGTTCCGGCA TCTGCTTTCC CTGCCTTTAT CCTATTTCGA GCACAGACGA
751  GTGGGTGATA CGGTGGCTCG GGTGCGGGAA TTGGAGCAGA TTCGCAATTT
801  CTTGACCGGT CAGGCGCTGA CTTCGGTGTT GGATTTGGCG TTTTCGTTTA
851  TCTTTCTGGC GGTGATGTGG TATTACAGCT CCACTCTGAC TTGGGTGGTA
901  TTGGCTTCGT TGCCTGCCTA TGCGTTTTGG TCGGCATTTA TCAGTCCGAT
951  ACTGCGGACG CGTCTGAACG ATAAGTTCGC GCGCAATGCA GACAACCAGT
1001 CGTTTTTAGT AGAAAGCATC ACTGCGGTGG GTACGGTAAA GGCGATGGCG
1051 GTGGAGCCGC AGATGACGCA GCGTTGGGAC AATCAGTTGG CGGCTTATGT
1101 GGCTTCGGGA TTTCGGGTAA CGAAGTTGGC GGTGGTCGGC CAGCAGGGGG
1151 TGCAGCTGAT TCAGAAGCTG GTGACGGTGG CGACGTTGTG GATTGGCGCA
1201 CGGCTGGTAA TTGAGAGCAA GCTGACGGTG GGGCAGCTGA TTGCGTTTAA
1251 TATGCTCTCG GGACAGGTGG CGGCGCCTGT TATCCGTTTG GCGCAGTTGT
1301 GGCAGGATTT CCAGCAGGTG GGGATTTCGG TGGCGCGTTT GGGGGATATT
1351 CTGAATGCGC CGACCGAGAA TGCGTCTTCG CATTTGGCTT TGCCCGATAT
1401 CCGGGGGGAG ATTACGTTCG AACATGTCGA TTTCCGCTAT AAGGCGGACG
1451 GCAGGCTGAT TTTGCAGGAT TTGAACCTGC GGATTCGGGC GGGGGAAGTG
1501 CTGGGGATTG TGGGACGTTC GGGGTCGGGC AAATCCACAC TCACCAAATT
1551 GGTGCAGCGT CTGTATGTAC CGGCGCAGGG ACGGGTGTTG GTGGACGGCA
1601 ACGATTTGGC TTTGGCCGCT CCTGCTTGGC TGCGGCGGCA GGTCGGCGTG
1651 GTCTTGCAGG AGAATGTGCT GCTCAACCGC AGCATACGCG ACAATATCGC
1701 GCTGACGGAT ACGGGTATGC CGCTGGAACG CATTATCGAA GCAGCCAAAC
1751 TGGCGGGCGC ACACGAGTTT ATTATGGAGC TGCCGGAAGG CTACGGCACC
1801 GTGGTGGGCG AACAAGGGGC CGGCTTGTCG GGCGGACAGC GGCAGCGTAT
1851 TGCGATTGCC CGCGCGTTAA TCACCAATCC GCGCATTCTG ATTTTTGATG
1901 AAGCCACCAG CGCGCTGGAT TATGAAAGTG AACGAGCGAT TATGCAGAAC
1951 ATGCAGGCCA TTTGCGCCAA CCGGACGGTG CTGATTATCG CCCACCGTCT
2001 GTCCACTGTT AAAACGGCAC ACCGGATCAT TGCCATGGAT AAAGGCAGGA
2051 TTGTGGAAGC GGGAACACAG CAGGAATTGC TGGCGAAGCC GAACGGATAT
2101 TACCGCTATC TGTATGATTT ACAGAACGGG TAG
它编码的蛋白质具有氨基酸序列<SEQ ID 30>:
1   MSIVSAPLPA LSALIILAHY HGIAANPADI QHEFCTSAQS DLNETQWLLA
51  AKSLGLKAKV VRQPIKRLAM ATLPALVWCD DGNHFILAKT DGGGEHAQYL
101 IQDLTTNKSA VLSFAEFSNR YSGKLILVAS RASVLGSLAK FDFTWFIPAV
151  IKYRRL FFEV LVVSVVLQLF ALITPLFFQV VMDKVLVHRG FSTLD VVSVA
201  LLVVSLFEIV LGGLRTYLFA HTTSRIDVEL GARLFRHLLS LPLSYFEHRR
251  VGDTVARVRE LEQIRNFLTG QA LTSVLDLA FSFIFLAVMW YYSSTLTW VV
301  LASLPAYAFW SAFISPILRT RLNDKFARNA DNQSFLVESI TAVGTVKAMA
351  VEPQMTQRWD NQLAAYVASG FRVTKLAVVG QQGVQLIQKL VTVATLWIGA
401  RLVIESKLTV GQLIAFNMLS GQVAAPVIRL AQLWQDFQQV GISVARLGDI
451  LNAPTENASS HLALPDIRGE ITFEHVDFRY KADGRLILQD LNLRIRAGEV
501  LGIVGRSGSG KSTLTKLVQR LYVPAQGRVL VDGNDLALAA PAWLRRQVGV
551  VLQENVLLNR SIRDNIALTD TGMPLERIIE AAKLAGAHEF IMELPEGYGT
601  VVGEQGAGLS GGQRQRIAIA RALITNPRIL IFDEATSALD YESERAIMQN
651  MQAICANRTV LIIAHRLSTV KTAHRIIAMD KGRIVEAGTQ QELLAKPNGY
701  YRYLYDLQNG*
ORF39a与大叶性肺炎放线杆菌的溶细胞素同源:
sp|P26760|RT1_ACTPL RTX-I毒素决定簇B(毒素RTX-I分泌ATP-结合蛋白)(APX-IB)(HLY-IB)(溶细胞素IB)(CLY-IB)
>gi|97137|pir||D43599溶细胞素IB-大叶性肺炎放线杆菌(serotype 9)>gi|38944(X61112)ClyI-B蛋白[大叶性肺炎放线杆菌]长度=707
评分=931bits(2379),预计=0.0
相同性=472/690(68%),阳性=540/690(77%),空隙=3/690(0%)
询问:20  YHGIAANPADIQHEFCTSAQSDLNETQWXXXXXXXXXXXXVVRQPIKRLAMATLPALVWC 79
           YH IA NP +++H+F    +  L+T W              V++I  RLA   LPALVW
目标:20  YHNIAVNPEELKHKFDLEGKG-LDLTAWLLAAKSLELKAKQVKKAIDRLAFIALPALVWR 78
询问:80  DDGNHFILAKTDGGGEHAQYLIQDLTTNKSAVLSFAEFSNRYSGKLILVASRASVLGSLA 139
           +DG HFIL K D   E  +YLI DL T+   +L  AEF + Y GKLILVASRAS++G LA
目标:79  EDGKHFILTKIDN--EAKKYLIFDLETHNPRILEQAEFESLYQGKLILVASRASIVGKLA 136
询问:140 KFDFTWFIPAVIKYRRXXXXXXXXXXXXXXXXXITPLFFQVVMDKVLVHRGFXXXXXXXX 199
           KFDFTWFIPAVIKYR+                 ITPLFFQVVMDKVLVHRGF
目标:137 KFDFTWFIPAVIKYRKIFIETLIVSIFLQIFALITPLFFQVVMDKVLVHRGFSTLNVITV 196
询问:200 XXXXXXXFEIVLGGLRTYLFAHTTSRIDVELGARLFRHLLSLPLSYFEHRRVGDTVARVR 259
                  FEIVL GLRTY+FAH+TSRIDVELGARLFRHLL+LP+SYFE+RRVGDTVARVR
目标:197 ALAIVVLFEIVLNGLRTYIFAHSTSRIDVELGARLFRHLLALPISYFENRRVGDTVARVR 256
询问:260 ELEQIRNFLTGQALTSVLDLAFSFIFLAVMWYYSSTLTWVVLASLPAYAFWSAFISPILR 319
           EL+QIRNFLTGQALTSVLDL FSFIF AVMWYYS LT V+L SLP Y   WS FISPILR
目标:257 ELDQIRNFLTGQALTSVLDLMFSFIFFAVMWYYSPKLTLVILGSLPFYMGWSIFISPILR 316
询问:320 TRLNDKFARNADNQSFLVESITAVGTVKAMAVEPQMTQRWDNQLAAYVASGFRVTKLAVV 379
            RL++KFAR ADNQSFLVES+TA+ T+KA+AV PQMT  WD QLA+YV++GFRVT LA +
目标:317 RRLDEKFARGADNQSFLVESVTAINTIKALAVTPQMTNTWDKQLASYVSAGFRVTTLATI 376
询问:380 GQQGVQLIQKLVTVATLWIGARLVIESKLTVGQLIAFNMLSGQVAAPVIRLAQLWQDFQQ 439
           GQQGVQ IQK+V V TLW+GA LVI  L++GQLIAFNMLSGQV APVIRLAQLWQDFQQ
目标:377 GQQGVQFIQKVVMVITLWLGAHLVISGDLSIGQLIAFNMLSGQVIAPVIRLAQLWQDFQQ 436
询问:440 VGISVARLGDILNAPTENASSHLALPDIRGEITFEHVDFRYKADGRLILQDLNLRIRAGE 499
           VGISV RLGD+LN+PTE+    LALP+I+G+ITF ++ FRYK D  +IL D+NL I+GE
目标:437 VGISVTRLGDVLNSPTESYQGKLALPEIKGDITFRNIRFRYKPDAPVILNDVNLSIQQGE 496
询问:500 VLGIVGRSGSGKSTLTKLVQRLYVPAQGRVLVDGNDLALAAPAWLRRQVGVVLQENVLLN 559
           V+GIVGRSGSGKSTLTKL+QR Y+P  G+VL+DG+DLALA P WLRRQVGVVLQ+NVLLN
目标:497 VIGIVGRSGSGKSTLTKLIQRFYIPENGQVLIDGHDLALADPNWLRRQVGVVLQDNVLLN 556
询问:560 RSIRDNIALTDTGMPLERIIEAAKLAGAHEFIMELPEGYGTVVGEQGAGLSGGQRQRIAI 619
           RSIRDNIAL D GMP+E+I+ AAKLAGAHEFI EL EGY T+VGEQGAGLSGGQRQRIAI
目标:557 RSIRDNIALADPGMPMEKIVHAAKLAGAHEFISELREGYNTIVGEQGAGLSGGQRQRIAI 616
询问:620 ARALITNPRILIFDEATSALDYESERAIMQNMQAICANRTVLIIAHRLSTVKTAHRIIAM 679
           ARAL+NP+ILIFDEATSALDYESE   IM+NM  IC  RTV+IIAHRLSTVK A RII M
目标:617 ARALVNNPKILIFDEATSALDYESEHIIMRNMHQICKGRTVIIIAHRLSTVKNADRIIVM 676
询问:680 DKGRIVEAGTQQELLAKPNGYYRYLYDLQN 709
           +KG+IVE G  +ELLA PNG Y YL+LQ+
目标:677 EKGQIVEQGKHKELLADPNGLYHYLHQLQS 706
与伴放线菌素嗜血菌的HlyB白细胞毒素分泌ATP-结合蛋白(登录号X53955)的 同源性
ORF39和HlyB蛋白显示在N端和C端区域的167和55个重叠氨基酸内分别有71%和69%氨基酸相同性:
orf39  1  KFDFTWFIPAVIKYRRXXXXXXXXXXXXXXXXXITPLFFQVVMDKVLVHRGFXXXXXXXX 60
          KFDFTWFIPAVIKYR+                 ITPLFFQVVMDKVLVHRGF
HlyB  137 KFDFTWFIPAVIKYRKIFIETLIVSIFLQIFALITPLFFQVVMDKVLVHRGFSTLNVITV 196
orf39  61 XXXXXXXFEIVLGGLRTYLFAHTTSRIDVELGARLFRHLLSLPLSYFEHRRVGDTVARVR 120
                 FEI+LGGLRTY+FAH+TSRIDVELGARLFRHLL+LP+SYFE RRVGDTVARVR
HlyB  197 ALAIVVLFEIILGGLRTYVFAHSTSRIDVELGARLFRHLLALPISYFEARRVGDTVARVR 256
orf39 121 ELEQIRNFLTGQALTSVLDLAFSFIFLAVMWYYSSTLTWVVLASLIC 167
          EL+QIRNFLTGQALTS+LDL FSFIF AVMWYYS  LT VVL SL C
HlyB  257 ELDQIRNFLTGQALTSILDLLFSFIFFAVMWYYSPKLTLVVLGSLPC 303
                                               //
orf39 166 ICANRTVLIIAHRLSTVKTAHRIIAMDKGRIVEAGTQQELLANXNGYYRYLYDLQ 220
          IC NRTVLIIAHRLSTVK A RII MDKG I+E G QELL +   G Y YL+ LQ
HlyB  651 ICQNRTVLIIAHRLSTVKNADRIIVMDKGEIIEQGKHQELLKDEKGLYSYLHQLQ 705
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
实施例7
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 31>
1    ATGAAATACT TGATCCGCAC CGCCTTACTC GCAGTCGCAG CCGCCGGCAT
51   CTACGCCTGC CAACCGCAAT CCGAAGCCGC AGTGCAAGTC AAGGCTGAAA
101  ACAGCCTGAC CGCTATGCGC TTAGCCGTCG CCGACAAACA GGCAGAGATT
151  GACGGGTTGA ACGCCCAAAk sGACGCCGAA ATCAGA...
它对应于氨基酸序列<SEQ ID 32;ORF52>:
1   MKYL IRTALL AVAAAGIYAC QPQSEAAVQV KAENSLTAMR LAVADKQAEI
51  DGLNAQXDAE IR..
进一步的工作揭示了完整的核苷酸序列<SEQ ID 33>:
1   ATGAAATACT TGATCCGCAC CGCCTTACTC GCAGTCGCAG CCGCCGGCAT
51  CTACGCCTGC CAACCGCAAT CCGAAGCCGC AGTGCAAGTC AAGGCTGAAA
101 ACAGCCTGAC CGCTATGCGC TTAGCCGTCG CCGACAAACA GGCAGAGATT
151 GACGGGTTGA ACGCCCAAAT CGACGCCGAA ATCAGACAAC GCGAAGCCGA
201 AGAATTGAAA GACTACCGAT GGATACACGG CGACGCGGAA GTGCCGGAGC
251 TGGAAAAATG A
它对应于氨基酸序列<SEQ ID 34;ORF52-1>:
1   MKYLIRTALL AVAAAGIYAC QPQSEAAVQV KAENSLTAMR LAVADKQAEI
51  DGLNAQIDAE IRQREAEELK DYRWIHGDAE VPELEK*
该氨基酸序列的计算机分析预计了一个原核细胞膜脂蛋白脂质连接部位(下划线)。
如上所述,将ORF52-1(7kDa)克隆到pGex载体中,并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图4A显示了GST-融合物亲和纯化的结果。图4B显示了ORF52-1的亲水性曲线、抗原性指数和AMPHI区域。
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
实施例8
在脑膜炎奈瑟氏球菌中鉴定出下列DNA序列<SEQ ID 35>
1    ATGGTTATCG GAATATTACT CGCATCAAGC AAGCATGCTC TTGTCATTAC
51   TCTATTGTTA AATCCCGTCT TCCATGCATC CAGTTGCGTA TCGCGTTsGG
101  CAATACGGAA TAAAAtCTGC TGTTCTGCTT TGGCTAAATT TGCCAAATTG
151  TTTATTGTTT CTTTAGGaGC AGCTTGCTTA GCCGCCTTCG CTTTCGACAA
201  CGCCCCCACA GGCGCTTCCC AAGCgTTGCC TACCGTTACC GCACCCGTGG
251  CGATTCCCGC GCCCGCTTCG GCAGCCTGA
它对应于氨基酸序列<SEQ ID 36;ORF56>:
1     MVIGILLASS KHALVITLLL NPVFHASSCV SRXAIRNKIC CSALAKFAKL
51    FIVSLGAACL AAFAFDNAPT GASQALPTVT APVAIPAPAS AA*
进一步的工作揭示了完整的核苷酸序列<SEQ ID 37>:
1    ATGGCTTGTA CAGGTTTGAT GGTTTTTCCG TTAATGGTTA TCGGAATATT
51   ACTTGCATCA AGCAAGCCTG CTCCTTTCCT TACTCTATTG TTAAATGCCG
101  TCTTCCATGC ATCCAGTTGC GTATCGCGTT GGGCAATACG GAATAAAATC
151  TGCTGTTCTG CTTTGGCTAA ATTTGCCAAA TTGTTTATTG TTTCTTTAGG
201  AGCAGCTTGC TTAGCCGCCT TCGCTTTCGA CAACGCCCCC ACAGGCGCTT
251  CCCAAGCGTT GCCTACCGTT ACCGCACCCG TGGCGATTCC CGCGCCCGCT
301  TCGGCAGCCT GA
它对应于氨基酸序列<SEQ ID 38;ORF56-1>:
1    MACTGLMVFP LMVIGILLAS SKPAPFLTLL LNPVFHASSC VSRWAIRNKI
51   CCSALAKFAK LFIVSLGAAC LAAFAFDNAP TGASQALPTV TAPVAIPAPA
101  SAA*
该氨基酸序列的计算机分析预计了一个前导肽(下划线),并提示ORF56可能是膜蛋白或周质蛋白。
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
实施例9
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 39>
1    ATGTTCAGTA TTTTAAATGT GTTTCTTCAT TGTATTCTGG CTTGTGTAGT
51   CTCTGGTGAG ACGCCTACTA TATTTGGTAT CCTTGCTCTT TTTTACTTAT
101  TGTATCTTTC TTATCTTGCT GTTTTTAAGA TTTTCTTTTC TTTTTTCTTA
151  GACAGAGTTT CACTCCGGTC TCCCAGGCTG GAGTGCAAAT GGCATGACCC
201  TTTGGCTCAC TGGCTCACGG CCACTTCTGC TATTCTGCCG CCTCAGCCTC
251  CAGGG
它对应于氨基酸序列<SEQ ID 40;ORF63>:
1   M FSILNVFLH CILACVVSGE  TPTIFGILAL FYLLYLSYLA VFKIFFSFFL
51  DRVSLRSPRL ECKWHDPLAH WLTATSAILP PQPPG...
该氨基酸序列的计算机分析预计了一个跨膜区。
根据该分析,预计脑膜炎奈瑟氏球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原。
实施例10
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 41>
1   ..GTGCGGACGT GGTTGGTTTT TTGGTTGCAG CGTTTGAAAT ACCCGTTGTT
51    GCTTTGGATT GCGGATATGT TGCTGTACCG GTTGTTGGGC GGCGCGGAAA
101   TCGAATGCGG CCGTTGCCCT GTGCCGCCGA TGACGGATTG GCAGCATTTT
151   TTGCCGGCGA TGGGAACGGT GTCGGCTTGG GTGGCGGTGA TTTGGGCATA
201   CCTGATGATT GAAAGTGAAA AAAACGGAAG ATATTGA
它对应于氨基酸序列<SEQ ID 42;ORF69>:
1  ..VRTWLVFWLQ RLKYPLLLWI ADMLLYRLLG GAEIECGRCP VPPMTDWQHF
51   LPA MGTVSAW VAVIWAYLMI ESEKNGRY*
该氨基酸序列的计算机分析预计了一个跨膜区。
还鉴定了脑膜炎奈瑟氏球菌菌株A的相应ORF:
与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性
ORF69显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF69a)重叠的78个氨基酸内有96.2%的相同性:
                   10        20        30        40        50        60
orf69.pep  VRTWLVFWLQRLKYP LLLWIADMLLYRLLGGAEIECGRCPVPPMTDWQHFLPA MGTVSAW
           ||||||||||||||| ||| ||||||||||||| ||||||||||||||||||||: ||||:||
orf69a     VRTWLVFWLQRLKYP LLLCIADMLLYRLLGGAEIECGRCPVPPMTDWQHFLPT MGTVAAW
                   10        20        30        40        50        60
                   70        79
orf69.pep  VAVIWAYLMIESEKNGRYX
           |||||||||| |||||||||
orf69a     VAVIWAYLMIESEKNGRYX
                   70
ORF69a的核苷酸序列<SEQ ID 43>是:
1    GTGCGGACGT GGTTGGTTTT TTGGTTGCAG CGTTTGAAAT ACCCGTTGTT
51   GCTTTGTATT GCGGATATGC TGCTGTACCG GTTGTTGGGC GGCGCGGAAA
101  TCGAATGCGG CCGTTGCCCT GTACCGCCGA TGACGGATTG GCAGCATTTT
151  TTGCCGACGA TGGGAACGGT GGCGGCTTGG GTGGCGGTGA TTTGGGCATA
201  CCTGATGATT GAAAGTGAAA AAAACGGAAG ATATTGA
它编码的蛋白质具有氨基酸序列<SEQ ID 44>:
1   VRTWLVFWLQ RLKYP LLLCI ADMLLYRLLG GAEIECGRCP VPPMTDWQHF
51  LPT MGTVAAW VAVIWAYLMI ESEKNGRY*
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
实施例11
在脑膜炎奈瑟氏球菌中鉴定出下列DNA序列<SEQ ID 45>
1    ATGTTTCAAA ATTTTGATTT GGGCGTGTTC CTGCTTGCCG TCCTCCCCGT
51   GCTGCCCTCC ATTACCGTCT CGCACGTGGC GCGCGGCTAT ACGGCGCGCT
101  ACTGGGGAGA CAACACTGCC GAACAATACG GCAGGCTGAC ACTGAACCCC
151  CTGCCCCATA TCGATTTGGT CGGCACAATC ATCgTACCGC TGCTTACTTT
201  GATGTTCACG CCCTTCCTGT TCGGCTGGGC GCGTCCGATT CCTATCGATT
251  CGCGCAACTT CCGCAACCCG cGCCTTGCCT GGCGTTGCGT TGCCGCGTCC
301  GGCCCGCTGT CGAATCTAGC GATGGCTGTw CTGTGGGGCG TGGTTTTGGT
351  GCTGACTCCG TATGTCGGCG GGGCGTATCA GATGCCGTTG GCTCAAATGG
401  CAAACTACGG TATTCTGATC AATGCGATTC TGTTCGCGCT CAACATCATC
451  CCCATCCTGC CTTGGGACGG CGGCATTTTC ATCGACACCT TCCTGTCGGC
501  GAAATATTCG CAAGCGTTCC GCAAAATCGA ACCTTATGGG ACGTGGATTA
551  TCCTACTGCT GATGCTGACC sGGGTTTTGG GTGCGTTTAT wGCACCGATT
601  sTGCGGmTGc GTGATTGCrT TTGTGCAGAT GTwCGTCTGA CTGGCTTTCA
651  GACGGCATAA
它对应于氨基酸序列<SEQ ID 46;ORF77>:
1    MFQNFDLGVF LLAVLPVLPS ITVSHVARGY TARYWGDNTA EQYGRLTLNP
51   LP HIDLVGTI IVPLLTLMFT PFLFGWARPI PIDSRNFRNP RLAWRCVAAS
101  GP LSNLAMAV LWGVVLVLTP YVGGAYQMPL AQ MANYGILI NAILFALNII
151  PILPWDGGIF IDTFLSAKYS QAFRKIEPY G TWIILLLMLT XVLGAFIAPI
201  XRXRDCXCAD VRLTGFQTA*
进一步的工作揭示了完整的核苷酸序列<SEQ ID 47>:
1    ATGTTTCAAA ATTTTGATTT GGGCGTGTTT CTGCTTGCCG TCCTGCCCGT
51   GCTGCTCTCC ATTACCGTCA GGGAGGTGGC GCGCGGCTAT ACGGCGCGCT
101  ACTGGGGAGA CAACACTGCC GAACAATACG GCAGGCTGAC ACTGAACCCC
151  CTGCCCCATA TCGATTTGGT CGGCACAATC ATCGTACCGC TGCTTACTTT
201  GATGTTCACG CCCTTCCTGT TCGGCTGGGC GCGTCCGATT CCTATCGATT
251  CGCGCAACTT CCGCAACCCG CGCCTTGCCT GGCGTTGCGT TGCCGCGTCC
301  GGCCCGCTGT CGAATCTAGC GATGGCTGTT CTGTGGGGCG TGGTTTTGGT
351  GCTGACTCCG TATGTCGGCG GGGCGTATCA GATGCCGTTG GCTCAAATGG
401  CAAACTACGG TATTCTGATC AATGCGATTC TGTTCGCGCT CAACATCATC
451  CCCATCCTGC CTTGGGACGG CGGCATTTTC ATCGACACCT TCCTGTCGGC
501  GAAATATTCG CAAGCGTTCC GCAAAATCGA ACCTTATGGG ACGTGGATTA
551  TCCTACTGCT GATGCTGACC GGGGTTTTGG GTGCGTTTAT TGCACCGATT
601  GTGCGGCTGG TGATTGCGTT TGTGCAGATG TTCGTCTGA
它对应于氨基酸序列<SEQ ID 48;ORF77-1>:
1   MFQNFDLGVF LLAVLPVLLS ITVREVARGY TARYWGDNTA EQYGR LTLNP
51  LPHIDLVGTI IVPLLTLMFT PFLFGWARPI PIDSRNFRNP RLAWRCVAAS
101 GPLSN LAMAV LWGVVLVLTP YVGGAYQMPL AQMANY GILI NAILFALNII
151 PILPWDGGIF IDTFLSAKYS QAFRKIEPY G TWIILLLMLT GVLGAFIAPI
201 VRLVIAFVQM FV*
该氨基酸序列的计算机分析揭示一个推定的前导序列和数个跨膜结构域。
还鉴定了脑膜炎奈瑟氏球菌菌株A的一个相应的ORF:
与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性
ORF77显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF77a)在重叠的173个氨基酸内有96.5%的相同性:
                   10        20        30        40        50        60
orf77.pep  MFQNFDLGVFLLAVLPVLPSITVSHVARGYTARYWGDNTAEQYGR LTLNPLPHIDLVGTI
                                      |||||||||||||||||| |||||||||||||||
orf77a                                 RGYTARYWGDNTAEQYGR LTLNPLPHIDLVGTI
                                               10        20        30
                    70          80      90       100       110       120
orf77.pep   IVPLLTLMFTPFLFGWARPIPIDSRNFRNPRLAWRCVAASGPLSN LAMAVLWGVVLVLTP
            || ||||||||||||||||||||||||||||||||||||||||||| |||||||||||||||
orf77a      IVPLLTLMFTPFLFGWARPIPIDSRNFRNPRLAWRCVAASGPLSN LAMAVLWGVVLVLTP
                 40        50        60        70        80        90
                  130       140        150       160      170       180
orf77.pep   YVGGAYQMPLAQMANY GILINAILFALNIIPILPWDGGIFIDTFLSAKYSQAFRKIEPY G
            || ||||||||||||||  ||||||| |||||||| | ||||||||||||| |||||||||||
orf77a      YVGGAYQMPLAQMANY XILINAILXALNIIPILPWDGGIFIDTFLSAKXSQAFRKIEPY G
                100       110       120       130       140       150
                 190       200       210       220
orf77.pep   TWIILLLMLTXVLGAFIAPIXRXRDCXCADVRLTGFQTAX
            ||| |||||| ||||  ||||
orf77a      TWIIXLLMLTGVLGAXIAPIVQLVIAFVQMFVX
                160       170       180
ORF77-1和ORF77a显示在185个重叠的氨基酸内有96.8%的相同性:
                    10        20        30        40        50        60
orf77-1.pep MFQNFDLGVFLLAVLPVLLSITVREVARGYTARYWGDNTAEQYGRLTLNPLPHIDLVGTI
                                       |||||||||||||||||||||||||||||||||
orf77a                                 RGYTARYWGDNTAEQYGRLTLNPLPHIDLVGTI
                                               10        20        30
                    70          80      90       100       110       120
orf77-1.pep IVPLLTLMFTPFLFGWARPIPIDSRNFRNPRLAWRCVAASGPLSNLAMAVLWGVVLVLTP
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf77a      IVPLLTLMFTPFLFGWARPIPIDSRNFRNPRLAWRCVAASGPLSNLAMAVLWGVVLVLTP
                 40        50        60        70        80        90
                  130       140       150       160       170      180
orf77-1.pep YVGGAYQMPLAQMANYGILINAILFALNIIPILPWDGGIFIDTFLSAKYSQAFRKIEPYG
            |||||||||||||||| ||||||| ||||||||||||||||||||||| |||||||||||
orf77a      YVGGAYQMPLAQMANYXILINAILXALNIIPILPWDGGIFIDTFLSAKXSQAFRKIEPYG
                100       110       120       130       140       150
                 190       200       210
orf77-1.pep TWIILLLMLTGVLGAFIAPIVRLVIAFVQMFVX
            |||| |||||||||| |||||:|||||||||||
orf77a      TWIIXLLMLTGVLGAXIAPIVQLVIAFVQMFVX
                160       170       180
鉴定了ORF77a的部分核苷酸序列<SEQ ID 49>:
1    ..CGCGGCTATA CAGCGCGCTA CTGGGGTGAC AACACTGCCG AACAATACGG
51     CAGGCTGACA CTGAACCCCC TGCCCCATAT CGATTTGGTC GGCACAATCA
101    TCGTACCGCT GCTTACTTTG ATGTTTACGC CCTTCCTGTT CGGCTGGGCG
151    CGTCCGATTC CTATCGATTC GCGCAACTTC CGCAACCCGC GCCTTGCCTG
201    GCGTTGCGTT GCCGCGTCCG GCCCGCTGTC GAATCTGGCG ATGGCTGTTC
251    TGTGGGGCGT GGTTTTGGTG CTGACTCCGT ATGTCGGTGG GGCGTATCAG
301    ATGCCGTTGG CNCAAATGGC AAACTACNNN ATTCTGATCA ATGCGATTCT
351    GTNCGCGCTC AACATCATCC CCATCCTGCC TTGGGACGGC GGCATTTTCA
401    TCGACACCTT CCTGTCGGCN AAATANTCGC AAGCGTTCCG CAAAATCGAA
451    CCTTATGGGA CGTGGATTAT CCNGCTGCTT ATGCTGACCG GGGTTTTGGG
501    TGCGTNTATT GCACCGATTG TGCAGCTGGT GATTGCGTTT GTGCAGATGT
551    TCGTCTGA
它编码的蛋白质具有氨基酸序列<SEQ ID 50>:
1    ..RGYTARYWGD NTAEQYGR LT LNPLPHIDLV GTIIVPLLTL MFTPFLFGWA
51     RPIPIDSRNF RNPRLAWRCV AASGPLSN LA MAVLWGVVLV LTPYVGGAYQ
101    MPLAQMANY X ILINAILXAL NIIPILPWDG GIFIDTFLSA KXSQAFRKIE
151    PY GTWIIXLL MLTGVLGAXI APIVQLVIAF VQMFV*
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
实施例12
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 51>
1    ATGAACCTGA TTTCACGTTA CATCATCCGT CAAATGGCGG TTATGGCGGT
51   TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT
101  ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGCTG
151  GGCTACACCG CCCTCAAAAT GCCCGCCCGC GCCTACGAAC TGATTCCCCT
201  CGCCGTCCTT ATCGGCGGAC TGGTCTCCCT CAGCCAGCTT GCCGCCGGCA
251  GCGAACTGAC CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG
301  TTGATTCTGT CGCAGTTCGG TTTTATTTTT GCTATTGCCA CCGTCGCGCT
351  CGGCGAATGG GTTGCGCCCA CACTGAGCCA AAAAGCCGAA AACATCAAAG
401  CCGCCGCCAT CAACGGCAAA ATCAGCACCG GCAATACCGG CCTTTGGCTG
451  AAAGAAAAAA ACAGCGTGAT CAATGTGCGC GAAATGTTGC CCGACCAT..
它对应于氨基酸序列<SEQ ID 52;ORF112>:
1    MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEML
51   GYTALKMPAR AYE LIPLAVL IGGLVSLSQL AAGSELTVIK ASGMSTKK LL
101  LILSQFGFIF AIATVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL
151  KEKNSVINVR EMLPDH...
进一步的工作进一步揭示了部分核苷酸序列<SEQ ID 53>:
1    ATGAACCTGA TTTCACGTTA CATCATCCGT CAAATGGCGG TTATGGCGGT
51   TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT
101  ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGCTG
151  gGCTACACCG CCCTCAAAAT GCCCGCCCGC GCCTACGAAC TGATTCCCCT
201  CGCCGTCCTT ATCGGCGGAC TGGTCTCCCT CAGCCAGCTT GCCGCCGGCA
251  GCGAACTGAC CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG
301  TTGATTCTGT CGCAGTTCGG TTTTATTTTT GCTATTGCCA CCGTCGCGCT
351  CGGCGAATGG GTTGCGCCCA CACTGAGCCA AAAAGCCGAA AACATCAAAG
401  CCGCCGCCAT CAACGGCAAA ATCAGCACCG GCAATACCGG CCTTTGGCTG
451  AAAGAAAAAA ACAGCrTkAT CAATGTGCGC GAAATGTTGC CCGACCATAC
501  GCTTTTGGGC ATCAAAATTT GGGCGCGCAA CGATAAAAAC GAATTGGCAG
551  AGGCAGTGGA AGCCGATTCC GCCGTTTTGA ACAGCGACGG CAGTTGGCAG
601  TTGAAAAACA TCCGCCGCAG CACGCTTGGC GAAGACAAAG TCGAGGTCTC
651  TATTGCGGCT GAAGAAAACT GGCCGATTTC CGTCAAACGC AACCTGATGG
701  ACGTATTGCT CGTCAAACCC GACCAAATGT CCGTCGGCGA ACTGACCACC
751  TACATCCGCC ACCTCCAAAA CAACAGCCAA AACACCCGAA TCTACGCCAT
801  CGCATGGTGG CGCAAATTGG TTTACCCCGC CGCAGCCTGG GTGATGGCGC
851  TCGTCGCCTT TGCCTTTACC CCGCAAACCA CCCGCCACGG CAATATGGGC
901  TTAAAACTCT TCGGCGGCAT CTGTsTCGGA TTGCTGTTCC ACCTTGCCGG
951  ACGGCTCTTT GGGTTTACCA GCCAACTCGG...
它对应于氨基酸序列<SEQ ID 54;ORF112-1>:
1    MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEML
51   GYTALKMPAR AYE LIPLAVL IGGLVSLSQL AAGSELTVIK ASGMSTKK LL
101  LILSQFGFIF AIATVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL
151  KEKNSXINVR EMLPDHTLLG IKIWARNDKN ELAEAVEADS AVLNSDGSWQ
201  LKNIRRSTLG EDKVEVSIAA EENWPISVKR NLMDVLLVKP DQMSVGELTT
251  YIRHLQNNSQ NTRIYAIAWW RK LVYPAAAW VMALVAFAFT PQTTRHGN MG
301  LKLFGGICXG LLFHLAGRLF GFTSQL...
该氨基酸序列的计算机分析预计了两个跨膜结构域。
还鉴定了脑膜炎奈瑟氏球菌菌株A的相应的ORF:
与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性
ORF112显示与脑膜炎奈瑟氏球菌菌株A的ORF(ORF112a)在重叠的166个氨基酸内有96.4%的相同性:
                    10        20        30        40        50        60
orf112.pep  MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR
            |||||||||||||||||||||||||||||||||||||||||||||||||| |||||| ||
orf1 12a    MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMXGYTALKMXAR
                    10        20        30        40        50        60
                    70        80        90        100       110       120
orf112.pep  AYELIPLAVLIGGLVSLSQLAAGSELTVIKASGMSTKKLLLILSQFGFIFAIATVALGEW
            ||||:||||||||||| |||||||||:|||||||||||||||||||||||||||||||||
orf112a     AYELMPLAVLIGGLVSXSQLAAGSELXVIKASGMSTKKLLLILSQFGFIFAIATVALGEW
                    70        80        90       100       110       120
                   130        140       150      160
orf112.pep  VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSVINVREMLPDH
            |||||||||||||||||||||||||||||||||||:||||||||||
orf112a     VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSIINVREMLPDHTLLGIKIWARNDKN
                   130       140       150       160       170       180
orf1 12a    ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEEXWPISVKRNLMDVLLVKP
                   190       200       210       220       230       240
ORF112a的部分核苷酸序列是<SEQ ID 55>鉴定为:
1    ATGAACCTGA TTTCACGTTA CATCATCCGT CAAATGGCGG TTATGGCGGT
51   TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT
101  ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGNTG
151  GGNTACACCG CCCTCAAAAT GNCCGCCCGC GCCTACGAAC TGATGCCCCT
201  CGCCGTCCTT ATCGGCGGAC TGGTCTCTNT CAGCCAGCTT GCCGCCGGCA
251  GCGAACTGAN CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG
301  TTGATTCTGT CGCAGTTCGG TTTTATTTTT GCTATTGCCA CCGTCGCGCT
351  CGGCGAATGG GTTGCGCCCA CACTGAGCCA AAAAGCCGAA AACATCAAAG
401  CCGCGGCCAT CAACGGCAAA ATCAGTACCG GCAATACCGG CCTTTGGCTG
451  AAAGAAAAAA ACAGCATTAT CAATGTGCGC GAAATGTTGC CCGACCATAC
501  CCTGCTGGGC ATTAAAATCT GGGCCCGCAA CGATAAAAAC GAACTGGCAG
551  AGGCAGTGGA AGCCGATTCC GCCGTTTTGA ACAGCGACGG CAGTTGGCAG
601  TTGAAAAACA TCCGCCGCAG CACGCTTGGC GAAGACAAAG TCGAGGTCTC
651  TATTGCGGCT GAAGAAAANT GGCCGATTTC CGTCAAACGC AACCTGATGG
701  ACGTATTGCT CGTCAAACCC GACCAAATGT CCGTCGGCGA ACTGACCACC
751  TACATCCGCC ACCTCCAAAN NNACAGCCAA AACACCCGAA TCTACGCCAT
801  CGCATGGTGG CGCAAATTGG TTTACCCCGC CGCAGCCTGG GTGATGGCGC
851  TCGTCGCCTT TGCCTTTACC CCGCAAACCA CCCGCCACGG CAATATGGGC
901  TTAAAANTCT TCGGCGGCAT CTGTCTCGGA TTGCTGTTCC ACCTTGCCGG
951  NCGGCTCTTC NGGTTTACCA GCCAACTCTA CGGCATCCCG CCCTTCCTCG
1001 NCGGCGCACT ACCTACCATA GCCTTCGCCT TGCTCGCCGT TTGGCTGATA
1051 CGCAAACAGG AAAAACGCTA A
它编码的蛋白质具有氨基酸序列<SEQ ID 56>:
1    MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEMX
51   GYTALKMXAR AYE LMPLAVL IGGLVSXSQL AAGSELXVIK ASGMSTKK LL
101  LILSQFGFIF AIATVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL
151  KEKNSIINVR EMLPDHTLLG IKIWARNDKN ELAEAVEADS AVLNSDGSWQ
201  LKNIRRSTLG EDKVEVSIAA EEXWPISVKR NLMDVLLVKP DQMSVGELTT
251  YIRHLQXXSQ NTRIYAIAWW RK LVYPAAAW VMALVAFAFT PQTTRHGN MG
301 L KXFGGICLG LLFHLAGRLF XFTSQLYGIP PFLXGALPTI AFALLAVWLI
351 RKQEKR*
ORF112a和ORF112-1显示在326个重叠的氨基酸内有96.3%的相同性:
orf112a.pep     MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMXGYTALKMXAR
                ||||||||||||||||||||||||||||||||||||||||||||||||| ||||||| ||
orf112-1        MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR
orf112a.pep     AYELMPLAVLIGGLVSXSQLAAGSELXVIKASGMSTKKLLLILSQFGFIFAIATVALGEW
                ||||:||||||||||| |||||||||:|||||||||||||||||||||||||||||||||
orf112-1        AYELIPLAVLIGGLVSLSQLAAGSELTVIKASGMSTKKLLLILSQFGFIFAIATVALGEW
orf112a.pep     VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSIINVREMLPDHTLLGIKIWARNDKN
                ||||||||||||||||||||||||||||||||||| ||||||||||||||||||||||||
orf112-1        VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSXINVREMLPDHTLLGIKIWARNDKN
orf112a.pep     ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEEXWPISVKRNLMDVLLVKP
                |||||||||||||||||||||||||||||||||||||||||| |||||||||||||||||
orf112-1        ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEENWPISVKRNLMDVLLVKP
orf112a.pep     DQMSVGELTTYIRHLQXXSQNTRIYAIAWWRKLVYPAAAWVMALVAFAFTPQTTRHGNMG
                ||||||||||||||||  ||||||||||||||||||||||||||||||||||||||||||
orf112-1        DQMSVGELTTYIRHLQNNSQNTRIYAIAWWRKLVYPAAAWVMALVAFAFTPQTTRHGNMG
orf112a.pep     LKXFGGICLGLLFHLAGRLFXFTSQLYGIPPFLXGALPTIAFALLAVWLIRKQEKRX
                || ||||| ||||||||||| |||||
orf112-1        LKLFGGICXGLLFHLAGRLFGFTSQL
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
实施例13
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 57>
1   ..GCAGTAGCCG AAACTGCCAA CAGCCAGGGC AAAGGTAAAC AGGCAGGCAG
51    TTCGGTTTCT GTTTCACTGA AAACTTCAGG CGACCTTTGC GGCAAACTCA
101   AAACCACCCT TAAAACTTTG GTCTGCTCTT TGGTTTCCCT GAGTATGGTA
151   TTGCCTGCCC ATGCCCAAAT TACCACCGAC AAATCAGCAC CTAAAAACCA
201   GCAGGTCGTT ATCCTTAAAA CCAACACTGG TGCCCCCTTG GTGAATATCC
251   AAACTCCGAA TGGACGCGGA TTGAGCCACA ACCGCTA.TA CGCATTTGAT
301   GTTGACAACA AAGGGGCAGT GTTAAACAAC GACCGTAACA ATAATCCGTT
351   TGTGGTCAAA GGCAGTGCGC AATTGATTTT GAACGAGGTA CGCGGTACGG
401   CTAGCAAACT CAACGGCATC GTTACCGTAG GCGGTCAAAA GGCCGACGTG
451   ATTATTGCCA ACCCCAACGG CATTACCGTT AATGGCGGCG GCTTTAAAAA
501   TGTCGGTCGG GGCATCTTAA CTACCGGTGC GCCCCAAATC GGCAAAGACG
551   GTGCACTGAC AGGATTTGAT GTG CGTCAAG GCACATTGgA CCGTAGrAGC
601   AGCAGGTTGG AATGATAAAG GCGGAGCmrm yTACACCGGG GTACTTGCTC
651   GTGCAGTTGC TTTGCAGGGG AAATTwmmGG GTAAA.AACT GGCGGTTTCT
701   ACCGGTCCTC AGAAAGTAGA TTACGCCAGC GGCGAAATCA GTGCAGGTAC
751   GGCAGCGGGT ACGAAACCGA CTATTGCCCT TGATACTGCC GCACTGGGCG
801   GTATGTACGC CGACAGCATC ACACTGATTG CCAATGAAAA AGGCGTAGGC
851   GTCTAA
它对应于氨基酸序列<SEQ ID 58;ORF114>:
1  ..AVAETANSQG KGKQAGSSVS VSLKTSGDLC GKLKTT LKTL VCSLVSLSMV
51   LPAHAQITTD KSAPKNQQVV ILKTNTGAPL VNIQTPNGRG LSHNRXYAFD
101  VDNKGAVLNN DRNNNPFVVK GSAQLILNEV RGTASKLNGI VTVGGQKADV
151  IIANPNGITV NGGGFKNVGR GILTTGAPQI GKDGALTGFD VVKAHWTVXA
201   AGWNDKGGAX YTGVLARAVA LQGKXXGKXL AVSTGPQKVD YASGEISAGT
251   AAGTKPTIAL DTAALGGMYA DSITLIANEK GVGV*
进一步的工作揭示了完整的核苷酸序列<SEQ ID 59>:
1     ATGAATAAAG GTTTACATCG CATTATCTTT AGTAAAAAGC ACAGCACCAT
51    GGTTGCAGTA GCCGAAACTG CCAACAGCCA GGGCAAAGGT AAACAGGCAG
101   GCAGTTCGGT TTCTGTTTCA CTGAAAACTT CAGGCGACCT TTGCGGCAAA
151   CTCAAAACCA CCCTTAAAAC TTTGGTCTGC TCTTTGGTTT CCCTGAGTAT
201   GGTATTGCCT GCCCATGCCC AAATTACCAC CGACAAATCA GCACCTAAAA
251   ACCAGCAGGT CGTTATCCTT AAAACCAACA CTGGTGCCCC CTTGGTGAAT
301   ATCCAAACTC CGAATGGACG CGGATTGAGC CACAACCGCT ATACGCAGTT
351   TGATGTTGAC AACAAAGGGG CAGTGTTAAA CAACGACCGT AACAATAATC
401   CGTTTGTGGT CAAAGGCAGT GCGCAATTGA TTTTGAACGA GGTACGCGGT
451   ACGGCTAGCA AACTCAACGG CATCGTTACC GTAGGCGGTC AAAAGGCCGA
501   CGTGATTATT GCCAACCCCA ACGGCATTAC CGTTAATGGC GGCGGCTTTA
551   AAAATGTCGG TCGGGGCATC TTAACTACCG GTGCGCCCCA AATCGGCAAA
601   GACGGTGCAC TGACAGGATT TGATGTGCGT CAAGGCACAT TGACCGTAGG
651   AGCAGCAGGT TGGAATGATA AAGGCGGAGC CGACTACACC GGGGTACTTG
701   CTCGTGCAGT TGCTTTGCAG GGGAAATTAC AGGGTAAAAA CCTGGCGGTT
751   TCTACCGGTC CTCAGAAAGT AGATTACGCC AGCGGCGAAA TCAGTGCAGG
801   TACGGCAGCG GGTACGAAAC CGACTATTGC CCTTGATACT GCCGCACTGG
851   GCGGTATGTA CGCCGACAGC ATCACACTGA TTGCCAATGA AAAAGGCGTA
901   GGCGTCAAAA ATGCCGGCAC ACTCGAAGCG GCCAAGCAAT TGATTGTGAC
951   TTCGTCAGGC CGCATTGAAA ACAGCGGCCG CATCGCCACC ACTGCCGACG
1001  GCACCGAAGC TTCACCGACT TATCTCTCCA TCGAAACCAC CGAAAAAGGA
1051  GCGGCAGGCA CATTTATCTC CAATGGTGGT CGGATCGAGA GCAAAGGCTT
1101  ATTGGTTATT GAGACGGGAG AAGATATCAG CTTGCGTAAC GGAGCCGTGG
1151  TGCAGAATAA CGGCAGTCGC CCAGCTACCA CGGTATTAAA TGCTGGTCAT
1201  AATTTGGTGA TTGAGAGCAA AACTAATGTG AACAATGCCA AAGGCCCGGC
1251  TACTCTGTCG GCCGACGGCC GTACCGTCAT CAAGGAGGCC AGTATTCAGA
1301  CTGGCACTAC CGTATACAGT TCCAGCAAAG GCAACGCCGA ATTAGGCAAT
1351  AACACACGCA TTACCGGGGC AGATGTTACC GTATTATCCA ACGGCACCAT
1401  CAGCAGTTCC GCCGTAATAG ATGCCAAAGA CACCGCACAC ATCGAAGCAG
1451  GCAAACCGCT TTCTTTGGAA GCTTCAACAG TTACCTCCGA TATCCGCTTA
1501  AACGGAGGCA GTATCAAGGG CGGCAAGCAG CTTGCTTTAC TGGCAGACGA
1551  TAACATTACT GCCAAAACTA CCAATCTGAA TACTCCCGGC AATCTGTATG
1601  TTCATACAGG TAAAGATCTG AATTTGAATG TTGATAAAGA TTTGTCTGCC
1651  GCCAGCATCC ATTTGAAATC GGATAACGCT GCCCATATTA CCGGCACCAG
1701  TAAAACCCTC ACTGCCTCAA AAGACATGGG TGTGGAGGCA GGCTCGCTGA
1751  ATGTTACCAA TACCAATCTG CGTACCAACT CGGGTAATCT GCACATTCAG
1801  GCAGCCAAAG GCAATATTCA GCTTCGCAAT ACCAAGCTGA ACGCAGCCAA
1851  GGCTCTCGAA ACCACCGCAT TGCAGGGCAA TATCGTTTCA GACGGCCTTC
1901  ATGCTGTTTC TGCAGACGGT CATGTATCCT TATTGGCCAA CGGTAATGCC
1951  GACTTTACCG GTCACAATAC CCTGACAGCC AAGGCCGATG TCAATGCAGG
2001  ATCGGTTGGT AAAGGCCGTC TGAAAGCAGA CAATACCAAT ATCACTTCAT
2051  CTTCAGGAGA TATTACGTTG GTTGCCGGCA ACGGTATTCA GCTTGGTGAC
2101  GGAAAACAAC GCAATTCAAT CAACGGAAAA CACATCAGCA TCAAAAACAA
2151  CGGTGGTAAT GCCGACTTAA AAAACCTTAA CGTCCATGCC AAAAGCGGGG
2201  CATTGAACAT TCATTCCGAC CGGGCATTGA GCATAGAAAA TACCAAGCTG
2251  GAGTCTACCC ATAATACGCA TCTTAATGCA CAACACGAGC GGGTAACGCT
2301  CAACCAAGTA GATGCCTACG CACACCGTCA TCTAAGCATT ACCGGCAGCC
2351  AGATTTGGCA AAACGACAAA CTGCCTTCTG CCAACAAGCT GGTGGCTAAC
2401  GGTGTATTGG CACTCAATGC GCGCTATTCC CAAATTGCCG ACAACACCAC
2451  GCTGAGAGCG GGTGCAATCA ACCTTACTGC CGGTACCGCC CTAGTCAAGC
2501  GCGGCAACAT CAATTGGAGT ACCGTTTCGA CCAAAACTTT GGAAGATAAT
2551  GCCGAATTAA AACCATTGGC CGGACGGCTG AATATTGAAG CAGGTAGCGG
2601  CACATTAACC ATCGAACCTG CCAACCGCAT CAGTGCGCAT ACCGACCTGA
2651  GCATCAAAAC AGGCGGAAAA TTGCTGTTGT CTGCAAAAGG AGGAAATGCA
2701  GGTGCGCCTA GTGCTCAAGT TTCCTCATTG GAAGCAAAAG GCAATATCCG
2751  TCTGGTTACA GGAGAAACAG ATTTAAGAGG TTCTAAAATT ACAGCCGGTA
2801  AAAACTTGGT TGTCGCCACC ACCAAAGGCA AGTTGAATAT CGAAGCCGTA
2851  AACAACTCAT TCAGCAATTA TTTTCCTACA CAAAAAGCGG CTGAACTCAA
2901  CCAAAAATCC AAAGAATTGG AACAGCAGAT TGCGCAGTTG AAAAAAAGCT
2951  CGCCTAAAAG CAAGCTGATT CCAACCCTGC AAGAAGAACG CGACCGTCTC
3001  GCTTTCTATA TTCAAGCCAT CAACAAGGAA GTTAAAGGTA AAAAACCCAA
3051  AGGCAAAGAA TACCTGCAAG CCAAGCTTTC TGCACAAAAT ATTGACTTGA
3101  TTTCCGCACA AGGCATCGAA ATCAGCGGTT CCGATATTAC CGCTTCCAAA
3151  AAACTGAACC TTCACGCCGC AGGCGTATTG CCAAAGGCAG CAGATTCAGA
3201  GGCGGCTGCT ATTCTGATTG ACGGCATAAC CGACCAATAT GAAATTGGCA
3251  AGCCCACCTA CAAGAGTCAC TACGACAAAG CTGCTCTGAA CAAGCCTTCA
3301  CGTTTGACCG GACGTACAGG GGTAAGTATT CATGCAGCTG CGGCACTCGA
3351  TGATGCACGT ATTATTATCG GTGCATCCGA AATCAAAGCT CCCTCAGGCA
3401  GCATAGACAT CAAAGCCCAT AGTGATATTG TACTGGAGGC TGGACAAAAC
3451  GATGCCTATA CCTTCTTAAA AACCAAAGGT AAAAGCGGCA AAATCATCAG
3501  AAAAACCAAG TTTACCAGCA CCCGCGACCA CCTGATTATG CCAGCCCCCG
3551  TCGAGCTGAC CGCCAACGGC ATAACGCTTC AGGCAGGCGG CAACATCGAA
3501  GCTAATACCA CCCGCTTCAA TGCCCCTGCA GGTAAAGTTA CCCTGGTTGC
3651  GGGTGAAGAG CTGCAACTGC TGGCAGAAGA AGGCATCCAC AAGCACGAGT
3701  TGGATGTCCA AAAAAGCCGC CGCTTTATCG GCATCAAGGT AGGCAAGAGC
3751  AATTACAGTA AAAACGAACT GAACGAAACC AAATTGCCTG TCCGCGTCGT
3801  CGCCCAAACT GCAGCCACCC GTTCAGGCTG GGATACCGTG CTCGAAGGTA
3851  CCGAATTCAA AACCACGCTG GCCGGTGCGG ACATTCAGGC AGGTGTAGGC
3901  GAAAAAGCCC GTGCCGATGC GAAAATTATC CTCAAAGGCA TTGTGAACCG
3951  TATCCAGTCG GAAGAAAAAT TAGAAACCAA CTCAACCGTA TGGCAGAAAC
4001  AGGCCGGACG CGGCAGCACT ATCGAAACGC TGAAACTGCC CAGCTTCGAA
4051  AGCCCTACTC CGCCCAAACT GACCGCCCCC GGTGGCTATA TCGTCGACAT
4101  TCCGAAAGGC AATTTGAAAA CCGAAATCGA AAAGCTGGCC AAACAGCCCG
4151  AGTATGCCTA TCTGAAACAG CTCCAAGTAG CGAAAAACGT CAACTGGAAC
4201  CAGGTGCAAC TGGCTTACGA TAAATGGGAC TATAAGCAGG AAGGCTTAAC
4251  CAGAGCCGGT GCAGCGATTG TTACCATAAT CGTAACCGCA CTGACTTATG
4301  GATACGGCGC AACCGCAGCG GGCGGTGTAG CCGCTTCAGG AAGTAGTACA
4351  GCCGCAGCTG CCGGAACAGC CGCCACAACG ACAGCAGCAG CTACTACCGT
4401  TTCTACAGCG ACTGCCATGC AAACCGCTGC TTTAGCCTCC TTGTATAGCC
4451  AAGCAGCTGT ATCCATCATC AATAATAAAG GTGATGTCGG CAAAGCGTTG
4501  AAAGATCTCG GCACCAGTGA TACGGTCAAG CAGATTGTCA CTTCTGCCCT
4551  GACGGCGGGT GCATTAAATC AGATGGGCGC AGATATTGCC CAATTGAACA
4601  GCAAGGTAAG AACCGAACTG TTCAGCAGTA CGGGCAATCA AACTATTGCC
4651  AACCTTGGAG GCAGACTGGC TACCAATCTC AGTAATGCAG GTATCTCAGC
4701  TGGTATCAAT ACCGCCGTCA ACGGCGGCAG CCTGAAAGAC AACTTAGGCA
4751  ATGCCGCATT AGGAGCATTG GTTAATAGCT TCCAAGGAGA AGCCGCCAGC
4801  AAAATCAAAA CAACCTTCAG CGACGATTAT GTTGCCAAAC AGTTCGCCCA
4851  CGCTTTGGCT GGGTGTGTTA GCGGATTGGT ACAAGGAAAA TGTAAAGACG
4901  GGGCAATTGG CGCAGCAGTT GGGGAAATCG TAGCCGACTC CATGCTTGGC
4951  GGCAGAAACC CTGCTACACT CAGCGATGCG GAAAAGCATA AGGTTATCAG
5001  TTACTCGAAG ATTATTGCCG GCAGCGTGGC GGCACTCAAC GGCGGCGATG
5051  TGAATACTGC GGCGAATGCG GCTGAGGTGG CGGTAGTGAA TAATGCTTTG
5101  AATTTTGACA GTACCCCTAC CAATGCGAAA AAGCATCAAC CGCAGAAGCC
5151  CGACAAAACC GCACTGGAAA AAATTATCCA AGGTATTATG CCTGCACATG
5201  CAGCAGGTGC GATGACTAAT CCGCAGGATA AGGATGCTGC CATTTGGATA
5251  AGCAATATCC GTAATGGCAT CACAGGCCCG ATTGTGATTA CCAGCTATGG
5301  GGTTTATGCT GCAGGTTGGA CAGCTCCGCT GATCGGTACA GCGGGTAAAT
5351  TAGCTATCAG CACCTGCATG GCTAATCCTT CTGGTTGTAC TGTCATGGTC
5401  ACTCAGGCTG CCGAAGCGGG CGCGGGAATC GCCACGGGTG CGGTAACGGT
5451  AGGCAACGCT TGGGAAGCGC CTGTGGGGGC GTTGTCGAAA GCGAAGGCGG
5501  CCAAGCAGGC TATACCAACC CAGACAGTTA AAGAACTTGA TGGCTTACTA
5551  CAAGAATCAA AAAATATAGG TGCTGTAAAT ACACGAATTA ATATAGCGAA
5601  TAGTACTACT CGATATACAC CAATGAGACA AACGGGACAA CCGGTATCTG
5651  CTGGCTTTGA GCATGTTCTT GAGGGGCACT TCCATAGGCC TATTGCGAAT
5701  AACCGTTCAG TTTTTACCAT CTCCCCAAAT GAATTGAAGG TTATACTTCA
5751  AAGTAATAAA GTAGTTTCTT CTCCCGTATC GATGACTCCT GATGGCCAAT
5801  ATATGCGGAC TGTCGATGTA GGAAAAGTTA TTGGTACTAC TTCTATTAAA
5851  GAAGGTGGAC AACCCACAAC TACAATTAAA GTATTTACAG ATAAGTCAGG
5901  AAATTTGATT ACTACATACC CAGTAAAAGG AAACTAA
它对应于氨基酸序列<SEQ ID 60;ORF114-1>:
1    MNKGLHRIIF SKKHSTMVAV AETANSQGKG KQAGSSVSVS LKTSGDLCGK
51   LKTTLKTLVC SLVSLSMVLP AHAQITTDKS APKNQQVVIL KTNTGAPLVN
101  IQTPNGRGLS HNRYTQFDVD NKGAVLNNDR NNNPFVVKGS AQLILNEVRG
151  TASKLNGIVT VGGQKADVII ANPNGITVNG GGFKNVGRGI LTTGAPQIGK
201  DGALTGFDVR QGTLTVGAAG WNDKGGADYT GVLARAVALQ GKLQGKNLAV
251  STGPQKVDYA SGEISAGTAA GTKPTIALDT AALGGMYADS ITLIANEKGV
301  GVKNAGTLEA AKQLIVTSSG RIENSGRIAT TADGTEASPT YLSIETTEKG
351  AAGTFISNGG RIESKGLLVI ETGEDISLRN GAVVQNNGSR PATTVLNAGH
401  NLVIESKTNV NNAKGPATLS ADGRTVIKEA SIQTGTTVYS SSKGNAELGN
451  NTRITGADVT VLSNGTISSS AVIDAKDTAH IEAGKPLSLE ASTVTSDIRL
501  NGGSIKGGKQ LALLADDNIT AKTTNLNTPG NLYVHTGKDL NLNVDKDLSA
551  ASIHLKSDNA AHITGTSKTL TASKDMGVEA GSLNVTNTNL RTNSGNLHIQ
601  AAKGNIQLRN TKLNAAKALE TTALQGNIVS DGLHAVSADG HVSLLANGNA
651  DFTGHNTLTA KADVNAGSVG KGRLKADNTN ITSSSGDITL VAGNGIQLGD
701  GKQRNSINGK HISIKNNGGN ADLKNLNVHA KSGALNIHSD RALSIENTKL
751  ESTHNTHLNA QHERVTLNQV DAYAHRHLSI TGSQIWQNDK LPSANKLVAN
801  GVLALNARYS QIADNTTLRA GAINLTAGTA LVKRGNINWS TVSTKTLEDN
851  AELKPLAGRL NIEAGSGTLT IEPANRISAH TDLSIKTGGK LLLSAKGGNA
901  GAPSAQVSSL EAKGNIRLVT GETDLRGSKI TAGKNLVVAT TKGKLNIEAV
951  NNSFSNYFPT QKAAELNQKS KELEQQIAQL KKSSPKSKLI PTLQEERDRL
1001 AFYIQAINKE VKGKKPKGKE YLQAKLSAQN IDLISAQGIE ISGSDITASK
1051 KLNLHAAGVL PKAADSEAAA ILIDGITDQY EIGKPTYKSH YDKAALNKPS
1101 RLTGRTGVSI HAAAALDDAR IIIGASEIKA PSGSIDIKAH SDIVLEAGQN
1151 DAYTFLKTKG KSGKIIRKTK FTSTRDHLIM PAPVELTANG ITLQAGGNIE
1201 ANTTRFNAPA GKVTLVAGEE LQLLAEEGIH KHELDVQKSR RFIGIKVGKS
1251 NYSKNELNET KLPVRVVAQT AATRSGWDTV LEGTEFKTTL AGADIQAGVG
1301 EKARADAKII LKGIVNRIQS EEKLETNSTV WQKQAGRGST IETLKLPSFE
1351 SPTPPKLTAP GGYIVDIPKG NLKTEIEKLA KQP EYAYLKQ LQVAKNVNWN
1401 QVQLAYDKWD YKQEGLTRAG AAIVTIIVTA LTYGYGATAA GGVAASGSST
1451 AAAAGTAATT TAAATTVSTA TAMQTAALAS LYSQAAVSII NNKGDVGKAL
1501 KDLGTSDTVK QIVTSALTAG ALNQMGADIA QLNSKVRTEL FSSTGNQTIA
1551 NLGGRLATNL SNAGISAGIN TAVNGGSLKD NLGNAALGAL VNSFQGEAAS
1601 KIKTTFSDDY VAKQFAHALA GCVSGLVQGK CKDGAIGAAV GEIVADSMLG
1651 GRNPATLSDA EKHKVISYSK IIAGSVAALN GGDVNTAANA AEVAVVNNAL
1701 NFDSTPTNAK KHQPQKPDKT ALEKIIQGIM PAHAAGAMTN PQDKDAAIWI
1751 SNIRNGITGP IVITSYGVYA AGWTAPLIGT AGKLAISTCM ANPSGCTVMV
1801 TQAAEAGAGI ATGAVTVGNA WEAPVGALSK AKAAKQAIPT QTVKELDGLL
1851 QESKNIGAVN TRINIANSTT RYTPMRQTGQ PVSAGFEHVL EGHFHRPIAN
1901 NRSVFTISPN ELKVILQSNK VVSSPVSMTP DGQYMRTVDV GKVIGTTSIK
1951 EGGQPTTTIK VFTDKSGNLI TTYPVKGN*
该氨基酸序列的计算机分析预计了一个跨膜区,还给出了下列结果:
与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性
ORF114显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF114a)重叠的284个氨基酸内有91.9%的相同性:
                                      10        20        30        40
orf114.pep                    AVAETANSQGKGKQAGSSVSVSLKTSGDLCGKLKTTLKTLVC
                              ||||||||||||||||||||||||||||||||||||||||||
orf114a     MNKGLHRIIFSKKHSTMVAVAETANSQGKGKQAGSSVSVSLKTSGDLCGKLKTTLKTLVC
                    10        20        30        40        50        60
                  50        60        70        80        90       100
orf114.pep  SLVSLSMVLPAHAQITTDKSAPKNQQVVILKTNTGAPLVNIQTPNGRGLSHNRXYAFDVD
            |||||||      ||||||||||| ||||||||||||||||||||||||||||   ||||
orf114a     SLVSLSMXXXXXXQITTDKSAPKNXQVVILKTNTGAPLVNIQTPNGRGLSHNRYTQFDVD
                    70        80        90       100       110       120
                 110       120       130       140       150       160
orf114.pep  NKGAVLNNDRNNNPFVVKGSAQLILNEVRGTASKLNGIVTVGGQKADVIIANPNGITVNG
            |||||||||||||||:||||||||||||||||||||||||||||||||||||||||||||
orf114a     NKGAVLNNDRNNNPFLVKGSAQLILNEVRGTASKLNGIVTVGGQKADVIIANPNGITVNG
                   130       140       150       160       170       180
                 170       180       190       200       210       220
orf114.pep  GGFKNVGRGILTTGAPQIGKDGALTGFDVVKAHWTVXAAGWNDKGGAXYTGVLARAVALQ
            |||||||||||| |||||||||||||||| ::  || |||||||||| ||||||||||||
orf114a     GGFKNVGRGILTIGAPQIGKDGALTGFDVRQGTLTVGAAGWNDKGGADYTGVLARAVALQ
                   190       200       210       220       230       240
                 230       240       250       260       270       280
orf114.pep  GKXXGKXLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIANEKGV
            ||  || |||||||||||||||||||||||||||||||||||||||||||||||| ||||
orf114a     GKLQGKNLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIAXEKGV
                   250       260       270       280       290       300
orf114.pep  GVX
            ||
orf114a     GVKNAGTLEAAKQLIVTSSGRIENSGRIATTADGTEASPTYLXIETTEKGAXGTFISNGG
                   310       320       330       340       350       360
全长ORF114a的核苷酸序列<SEQ ID 61>是:
1    ATGAATAAAG GTTTACATCG CATTATCTTT AGTAAAAAGC ACAGCACCAT
51   GGTTGCAGTA GCCGAAACTG CCAACAGCCA GGGCAAAGGT AAACAGGCAG
101  GCAGTTCGGT TTCTGTTTCA CTGAAAACTT CAGGCGACCT TTGCGGCAAA
151  CTCAAAACCA CCCTTAAAAC CTTGGTCTGC TCTTTGGTTT CCCTGAGTAT
201  GGNATTNCNN NNCNNTNCCC AAATTACCAC CGACAAATCA GCACCTAAAA
251  ACCANCAGGT CGTTATCCTT AAAACCAACA CTGGTGCCCC CTTGGTGAAT
301  ATCCAAACTC CGAATGGACG CGGATTGAGC CACAACCGCT ATACGCAGTT
351  TGATGTTGAC AACAAAGGGG CAGTGTTAAA CAACGACCGT AACAATAATC
401  CGTTTCTGGT CAAAGGCAGT GCGCAATTGA TTTTGAACGA GGTACGCGGT
451  ACGGCTAGCA AACTCAACGG CATCGTTACC GTAGGCGGTC AAAAGGCCGA
501  CGTGATTATT GCCAACCCCA ACGGCATTAC CGTTAATGGC GGCGGCTTTA
551  AAAATGTCGG TCGGGGCATC TTAACTATCG GTGCGCCCCA AATCGGCAAA
601  GACGGTGCAC TGACAGGATT TGATGTGCGT CAAGGCACAT TGACCGTAGG
651  AGCAGCAGGT TGGAATGATA AAGGCGGAGC CGACTACACC GGGGTACTTG
701  CTCGTGCAGT TGCTTTGCAG GGGAAATTAC AGGGTAAAAA CCTGGCGGTT
751  TCTACCGGTC CTCAGAAAGT AGATTACGCC AGCGGCGAAA TCAGTGCAGG
801  TACGGCAGCG GGTACGAAAC CGACTATTGC CCTTGATACT GCCGCACTGG
851  GCGGTATGTA CGCCGACAGC ATCACACTGA TTGCCANTGA AAAAGGCGTA
901  GGCGTCAAAA ATGCCGGCAC ACTCGAAGCG GCCAAGCAAT TGATTGTGAC
951  TTCGTCAGGC CGCATTGAAA ACAGCGGCCG CATCGCCACC ACTGCCGACG
1001 GCACCGAAGC TTCACCGACT TATCTNNCNA TCGAAACCAC CGAAAAAGGA
1051 GCNNCAGGCA CATTTATCTC CAATGGTGGT CGGATCGAGA GCAAAGGCTT
1101 ATTGGTTATT GAGACGGGAG AAGATATCAN CTTGCGTAAC GGAGCCGTGG
1151 TGCAGAATAA CGGCAGTCGC CCAGCTACCA CGGTATTAAA TGCTGGTCAT
1201 AATTTGGTGA TTGAGAGTAA AACTAATGTG AACAATGCCA AAGGCTCGNC
1251 TAATCTGTCG GCCGGCGGTC GTACTACGAT CAATGATGCT ACTATTCAAG
1301 CGGGCAGTTC CGTGTACAGC TCCACCAAAG GCGATACTGA NTTGGGTGAA
1351 AATACCCGTA TTATTGCTGA AAACGTAACC GTATTATCTA ACGGTAGTAT
1401 TGGCAGTGCT GCTGTAATTG AGGCTAAAGA CACTGCACAC ATTGAATCGG
1451 GCAAACCGCT TTCTTTAGAA ACCTCGACCG TTGCCTCCAA CATCCGTTTG
1501 AACAACGGTA ACATTAAAGG CGGAAAGCAG CTTGCTTTAC TGGCAGACGA
1551 TAACATTACT GCCAAAACTA CCAATCTGAA TACTCCCGGC AATCTGTATG
1601 TTCATACAGG TAAAGATCTG AATTTGAATG TTGATAAAGA TTTGTCTGCC
1651 GCCAGCATCC ATTTGAAATC GGATAACGCT GCCCATATTA CCGGCACCAG
1701 TAAAACCCTC ACTGCCTCAA AAGACATGGG TGTGGAGGCA GGCTTGCTGA
1751  ATGTTACCAA TACCAATCTG CGTACCAACT CGGGTAATCT GCACATTCAG
1801  GCAGCCAAAG GCAATATTCA GCTTCGCAAT ACCAAGCTGA ACGCAGCCAA
1851  GGCTCTCGAA ACCACCGCAT TGCAGGGCAA TATCGTTTCA GACGGCCTTC
1901  ATGCTGTTTC TGCAGACGGT CATGTATCCT TATTGGCCAA CGGTAATGCC
1951  GACTTTACCG GTCACAATAC CCTGACAGCC AAGGCCGATG TCNATGCAGG
2001  ATCGGTTGGT AAAGGCCGTC TGAAAGCAGA CAATACCAAT ATCACTTCAT
2051  CTTCAGGAGA TATTACGTTG GTTGCCGNNN NCGGTATTCA GCTTGGTGAC
2101  GGAAAACAAC GCAATTCAAT CAACGGAAAA CACATCAGCA TCAAAAACAA
2151  CGGTGGTAAT GCCGACTTAA AAAACCTTAA CGTCCATGCC AAAAGCGGGG
2201  CATTGAACAT TCATTCCGAC CGGGCATTGA GCATAGAAAA TACNAAGCTG
2251  GAGTCTACCC ATAATACGCA TCTTAATGCA CAACACGAGC GGGTAACGCT
2301  CAACCAAGTA GATGCCTACG CACACCGTCA TCTAAGCATT ANCGGCAGCC
2351  AGATTTGGCA AAACGACAAA CTGCCTTCTG CCAACAAGCT GGTGGCTAAC
2401  GGTGTATTGG CANTCAATGC GCGCTATTCC CAAATTGCCG ACAACACCAC
2451  GCTGAGAGCG GGTGCAATCA ACCTTACTGC CGGTACCGCC CTAGTCAAGC
2501  GCGGCAACAT CAATTGGAGT ACCGTTTCGA CCAAGACTTT GGAAGATAAT
2551  GCCGAATTAA AACCATTGGC CGGACGGCTG AATATTGAAG CAGGTAGCGG
2601  CACATTAACC ATCGAACCTG CCAACCGCAT CAGTGCGCAT ACCGACCTGA
2651  GCATCAAAAC AGGCGGAAAA TTGCTGTTGT CTGCAAAAGG AGGAAATGCA
2701  GGTGCGCNTA GTGCTCAAGT TTCCTCATTG GAAGCAAAAG GCAATATCCG
2751  TCTGGTTACA GGAGNAACAG ATTTAAGAGG TTCTAAAATT ACAGCCGGTA
2801  AAAACTTGGT TGTCGCCACC ACCAAAGGCA AGTTGAATAT CGAAGCCGTA
2851  AACAACTCAT TCAGCAATTA TTTTCNTACA CAAAAAGNGN NNGNNCTCAA
2901  CCAAAAATCC AAAGAATTGG AACAGCAGAT TGCGCAGTTG AAAAAAAGCT
2951  CGCNTAAAAG CAAGCTGATT CCAACCCTGC AAGAAGAACG CGACCGTCTC
3001  GCTTTCTATA TTCAAGCCAT CAACAAGGAA GTTAAAGGTA AAAAACCCAA
3051  AGGCAAAGAA TACCTGCAAG CCAAGCTTTC TGCACAAAAT ATTGACTTGA
3101  TTTCCGCACA AGGCATCGAA ATCAGCGGTT CCGATATTAC CGCTTCCAAA
3151  AAACTGAACC TTCACGCCGC AGGCGTATTG CCAAAGGCAG CAGATTCAGA
3201  GGCGGCTGCT ATTCTGATTG ACGGCATAAC CGACCAATAT GAAATTGGCA
3251  AGCCCACCTA CAAGAGTCAC TACGACAAAG CTGCTCTGAA CAAGCCTTCA
3301  CGTTTGACCG GACGTACGGG GGTAAGTATT CATGCAGCTG CGGCACTCGA
3351  TGATGCACGT ATTATTATCG GTGCATCCGAAATCAAAGCT CCCTCAGGCA
3401  GCATAGACAT CAAAGCCCAT AGTGATATTG TACTGGAGGC TGGACAAAAC
3451  GATGCCTATA CCTTCTTANA AACCAAAGGT AAAAGCGGCA NAATNATCAG
3501  AAAAACNAAG TTTACCAGCA CCNGCGANCA CCTGATTATG CCAGCCCCNG
3551  TCGAGCTGAC CGCCAACGGT ATCACGCTTC AGGCAGGCGG CAACATCGAA
3601  GCTAATACCA CCCGCTTCAA TGCCCCTGCA GGTAAAGTTA CCCTGGTTGC
3651  GGGTGAANAG NTGCAACTGC TGGCAGAAGA AGGCATCCAC AAGCACGAGT
3701  TGGATGTCCA AAAAAGCCGC CGCTTTATCG GCATCAAGGT AGGTNAGAGC
3751  AATTACAGTA AAAACGAACT GAACGAAACC AAATTGCCTG TCCGCGTCGT
3801  CGCCCAAANT GCAGCCACCC GTTCAGGCTG GGATACCGTG CTCGAAGGTA
3851  CCGAATTCAA AACCACGCTG GCCGGTGCCG ACATTCAGGC AGGTGTANGC
3901  GAAAAAGCCC GTGTCGATGC GAAAATTATC CTCAAAGCCA TTGTGAACCG
3951  TATCCAGTCG GAAGAAAAAT TAGAAACCAA CTCAACCGTA TGGCAGAAAC
4001  AGGCCGGACG CGGCAGCACT ATCGAAACGC TAAAACTGCC CAGCTTCGAA
4051  AGCCCTACTC CGCCCAAATT GTCCGCACCC GGCGGNTATA TCGTCGACAT
4101  TCCGAAAGGC AATCTGAAAA CCGAAATCGA AAAGCTGTCC AAACAGCCCG
4151  AGTATGCCTA TCTGAAACAG CTCCAAGTAG CGAAAAACAT CAACTGGAAT
4201  CAGGTGCAGC TTGCTTACGA CAGATGGGAC TACAAACAGG AGGGCTTAAC
4251  CGAAGCAGGT GCGGCGATTA TCGCACTGGC CGTTACCGTG GTCACCTCAG
4301  GCGCAGGAAC CGGAGCCGTA TTGGGATTAA ACGGTGCGNC CGCCGCCGCA
4351  ACCGATGCAG CATTCGCCTC TTTGGCCAGC CAGGCTTCCG TATCGTTCAT
4401  CAACAACAAA GGCGATGTCG GCAAAACCCT GAAAGAGCTG GGCAGAAGCA
4451  GCACGGTGAA AAATCTGGTG GTTGCCGCCG CTACCGCAGG CGTAGCCGAC
4501  AAAATCGGCG CTTCGGCACT GANCAATGTC AGCGATAAGC AGTGGATCAA
4551  CAACCTGACC GTCAACCTAG CCAATGNCGG GCAGTGCCGC ACTGAttaa
它编码的蛋白质具有氨基酸序列<SEQ ID 62>:
1   MNKGLHRIIF SKKHSTMVAV AETANSQGKG KQAGSSVSVS LKTSGDLCGK
51  LKTTLKTLVC SLVSLSMXXX XXXQITTDKS APKNXQVVIL KTNTGAPLVN
101  IQTPNGRGLS HNRYTQFDVD NKGAVLNNDR NNNPFLVKGS AQLILNEVRG
151  TASKLNGIVT VGGQKADVII ANPNGITVNG GGFKNVGRGI LTIGAPQIGK
201  DGALTGFDVR QGTLTVGAAG WNDKGGADYT GVLARAVALQ GKLQGKNLAV
251  STGPQKVDYA SGEISAGTAA GTKPTIALDT AALGGMYADS ITLIAXEKGV
301  GVKNAGTLEA AKQLIVTSSG RIENSGRIAT TADGTEASPT YLXIETTEKG
351  AXGTFISNGG RIESKGLLVI ETGEDIXLRN GAVVQNNGSR PATTVLNAGH
401  NLVIESKTNV NNAKGSXNLS AGGRTTINDA TIQAGSSVYS STKGDTXLGE
451  NTRIIAENVT VLSNGSIGSA AVIEAKDTAH IESGKPLSLE TSTVASNIRL
501  NNGNIKGGKQ LALLADDNIT AKTTNLNTPG NLYVHTGKDL NLNVDKDLSA
551  ASIHLKSDNA AHITGTSKTL TASKDMGVEA GLLNVTNTNL RTNSGNLHIQ
601  AAKGNIQLRN TKLNAAKALE TTALQGNIVS DGLHAVSADG HVSLLANGNA
651  DFTGHNTLTA KADVXAGSVG KGRLKADNTN ITSSSGDITL VAXXGIQLGD
701  GKQRNSINGK HISIKNNGGN ADLKNLNVHA KSGALNIHSD RALSIENTKL
751  ESTHNTHLNA QHERVTLNQV DAYAHRHLSI XGSQIWQNDK LPSANKLVAN
801  GVLAXNARYS QIADNTTLRA GAINLTAGTA LVKRGNINWS TVSTKTLEDN
851  AELKPLAGRL NIEAGSGTLT IEPANRISAH TDLSIKTGGK LLLSAKGGNA
901  GAXSAQVSSL EAKGNIRLVT GXTDLRGSKI TAGKNLVVAT TKGKLNIEAV
951  NNSFSNYFXT QKXXXLNQKS KELEQQIAQL KKSSXKSKLI PTLQEERDRL
1001 AFYIQAINKE VKGKKPKGKE YLQAKLSAQN IDLISAQGIE ISGSDITASK
1051 KLNLHAAGVL PKAADSEAAA ILIDGITDQY EIGKPTYKSH YDKAALNKPS
1101 RLTGRTGVSI HAAAALDDAR IIIGASEIKA PSGSIDIKAH SDIVLEAGQN
1151 DAYTFLXTKG KSGXXIRKTK FTSTXXHLIM PAPVELTANG ITLQAGGNIE
1201 ANTTRFNAPA GKVTLVAGEX XQLLAEEGIH KHELDVQKSR RFIGIKVGXS
1251 NYSKNELNET KLPVRVVAQX AATRSGWDTV LEGTEFKTTL AGADIQAGVX
1301 EKARVDAKII LKGIVNRIQS EEKLETNSTV WQKQAGRGST IETLKLPSFE
1351 SPTPPKLSAP GGYIVDIPKG NLKTEIEKLS KQP EYAYLKQ LQVAKNINWN
1401 QVQLAYDRWD YKQEGLTEAG AAIIALAVTV VTSGAGTGAV LGLNGAXAAA
1451 TDAAFASLAS QASVSFINNK GDVGKTLKEL GRSSTVKNLV VAAATAGVAD
1501 KIGASALXNV SDKQWINNLT VNLANXGQCR TD*
ORF114-1和ORF114a显示在1564个重叠的氨基酸内有89.8%的相同性。
orf114a.pep   MNKGLHRIIFSKKHSTMVAVAETANSQGKGKQAGSSVSVSLKTSGDLCGKLKTTLKTLVC
              ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf114-1      MNKGLHRIIFSKKHSTMVAVAETANSQGKGKQAGSSVSVSLKTSGDLCGKLKTTLKTLVC
orf114a.pep   SLVSLSMXXXXXXQITTDKSAPKNXQVVILKTNTGAPLVNIQTPNGRGLSHNRYTQFDVD
              |||||||       |||||||||| |||||||||||||||||||||||||||||||||||
orf114-1      SLVSLSMVLPAHAQITTDKSAPKNQQVVILKTNTGAPLVNIQTPNGRGLSHNRYTQFDVD
orf114a.pep   NKGAVLNNDRNNNPFLVKGSAQLILNEVRGTASKLNGIVTVGGQKADVIIANPNGITVNG
              |||||||||||||||:||||||||||||||||||||||||||||||||||||||||||||
orf114-1      NKGAVLNNDRNNNPFVVKGSAQLILNEVRGTASKLNGIVTVGGQKADVIIANPNGITVNG
orf114a.pep   GGFKNVGRGILTIGAPQIGKDGALTGFDVRQGTLTVGAAGWNDKGGADYTGVLARAVALQ
              |||||||||||| |||||||||||||||||||||||||||||||||||||||||||||||
orf114-1      GGFKNVGRGILTTGAPQIGKDGALTGFDVRQGTLTVGAAGWNDKGGADYTGVLARAVALQ
orf114a.pep   GKLQGKNLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIAXEKGV
              ||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||
orf114-1      GKLQGKNLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIANEKGV
orf114a.pep   GVKNAGTLEAAKQLIVTSSGRIENSGRIATTADGTEASPTYLXIETTEKGAXGTFISNGG
              |||||||||||||||||||||||||||||||||||||||||| |||||||| ||||||||
orf114-1      GVKNAGTLEAAKQLIVTSSGRIENSGRIATTADGTEASPTYLSIETTEKGAAGTFISNGG
orf114a.pep   RIESKGLLVIETGEDIXLRNGAVVQNNGSRPATTVLNAGHNLVIESKTNVNNAKGSXNLS
              |||||||||||||||| ||||||||||||||||||||||||||||||||||||||  :||
orf114-1      RIESKGLLVIETGEDISLRNGAVVQNNGSRPATTVLNAGHNLVIESKTNVNNAKGPATLS
orf114a.pep   AGGRTTINDATIQAGSSVYSSTKGDTXLGENTRIIAENVTVLSNGSIGSAAVIEAKDTAH
              | |||:|::|:||:|::||||:||:: ||:|||| : :|||||||:|:|:|||:||||||
orf114-1     ADGRTVIKEASIQTGTTVYSSSKGNAELGNNTRITGADVTVLSNGTISSSAVIDAKDTAH
orf114a.pep  IESGKPLSLETSTVASNIRLNNGNIKGGKQLALLADDNITAKTTNLNTPGNLYVHTGKDL
             ||:|||||||:|||:|:||||:|:||||||||||||||||||||||||||||||||||||
orf114-1     IEAGKPLSLEASTVTSDIRLNGGSIKGGKQLALLADDNITAKTTNLNTPGNLYVHTGKDL
orf114a.pep  NLNVDKDLSAASIHLKSDNAAHITGTSKTLTASKDMGVEAGLLNVTNTNLRTNSGNLHIQ
             ||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||
orf114-1     NLNVDKDLSAASIHLKSDNAAHITGTSKTLTASKDMGVEAGSLNVTNTNLRTNSGNLHIQ
orf114a.pep  AAKGNIQLRNTKLNAAKALETTALQGNIVSDGLHAVSADGHVSLLANGNADFTGHNTLTA
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf114-1     AAKGNIQLRNTKLNAAKALETTALQGNIVSDGLHAVSADGHVSLLANGNADFTGHNTLTA
orf114a.pep  KADVXAGSVGKGRLKADNTNITSSSGDITLVAXXGIQLGDGKQRNSINGKHISIKNNGGN
             |||| |||||||||||||||||||||||||||  ||||||||||||||||||||||||||
orf114-1     KADVNAGSVGKGRLKADNTNITSSSGDITLVAGNGIQLGDGKQRNSINGKHISIKNNGGN
orf114a.pep  ADLKNLNVHAKSGALNIHSDRALSIENTKLESTHNTHLNAQHERVTLNQVDAYAHRHLSI
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf114-1     ADLKNLNVHAKSGALNIHSDRALSIENTKLESTHNTHLNAQHERVTLNQVDAYAHRHLSI
orf114a.pep  XGSQIWQNDKLPSANKLVANGVLAXNARYSQIADNTTLRAGAINLTAGTALVKRGNINWS
             :||||||||||||||||||||||| |||||||||||||||||||||||||||||||||||
orf114-1     TGSQIWQNDKLPSANKLVANGVLALNARYSQIADNTTLRAGAINLTAGTALVKRGNINWS
orf114a.pep  TVSTKTLEDNAELKPLAGRLNIEAGSGTLTIEPANRISAHTDLSIKTGGKLLLSAKGGNA
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf114-1     TVSTKTLEDNAELKPLAGRLNIEAGSGTLTIEPANRISAHTDLSIKTGGKLLLSAKGGNA
orf114a.pep  GAXSAQVSSLEAKGNIRLVTGXTDLRGSKITAGKNLVVATTKGKLNIEAVNNSFSNYFXT
             || |||||||||||||||||| |||||||||||||||||||||||||||||||||||| |
orf114-1     GAPSAQVSSLEAKGNIRLVTGETDLRGSKITAGKNLVVATTKGKLNIEAVNNSFSNYFPT
orf114a.pep  QKXXXLNQKSKELEQQIAQLKKSSXKSKLIPTLQEERDRLAFYIQAINKEVKGKKPKGKE
             ||   ||||||||||||||||||| |||||||||||||||||||||||||||||||||||
orf114-1     QKAAELNQKSKELEQQIAQLKKSSPKSKLIPTLQEERDRLAFYIQAINKEVKGKKPKGKE
orf114a.pep  YLQAKLSAQNIDLISAQGIEISGSDITASKKLNLHAAGVLPKAADSEAAAILIDGITDQY
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf114-1     YLQAKLSAQNIDLISAQGIEISGSDITASKKLNLHAAGVLPKAADSEAAAILIDGITDQY
orf114a.pep  EIGKPTYKSHYDKAALNKPSRLTGRTGVSIHAAAALDDARIIIGASEIKAPSGSIDIKAH
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf114-1     EIGKPTYKSHYDKAALNKPSRLTGRTGVSIHAAAALDDARIIIGASEIKAPSGSIDIKAH
orf114a.pep  SDIVLEAGQNDAYTFLXTKGKSGXXIRKTKFTSTXXHLIMPAPVELTANGITLQAGGNIE
             |||||||||||||||| ||||||  |||||||||  ||||||||||||||||||||||||
orf114-1     SDIVLEAGQNDAYTFLKTKGKSGKIIRKTKFTSTRDHLIMPAPVELTANGITLQAGGNIE
orf114a.pep  ANTTRFNAPAGKVTLVAGEXXQLLAEEGIHKHELDVQKSRRFIGIKVGXSNYSKNELNET
             |||||||||||||||||||  ||||||||||||||||||||||||||| |||||||||||
orf114-1     ANTTRFNAPAGKVTLVAGEELQLLAEEGIHKHELDVQKSRRFIGIKVGKSNYSKNELNET
orf114a.pep  KLPVRVVAQXAATRSGWDTVLEGTEFKTTLAGADIQAGVXEKARVDAKIILKGIVNRIQS
             |||||||||:||||||||||||||||||||||||||||| ||||:|||||||||||||||
orf114-1     KLPVRVVAQTAATRSGWDTVLEGTEFKTTLAGADIQAGVGEKARADAKIILKGIVNRIQS
orf114a.pep  EEKLETNSTVWQKQAGRGSTIETLKLPSFESPTPPKLSAPGGYIVDIPKGNLKTEIEKLS
             |||||||||||||||||||||||||||||||||||||:|||||||||||||||||||||:
orf114-1     EEKLETNSTVWQKQAGRGSTIETLKLPSFESPTPPKLTAPGGYIVDIPKGNLKTEIEKLA
orf114a.pep    KQPEYAYLKQLQVAKNINWNQVQLAYDRWDYKQEGLTEAGAAIIALAVTVVTSGAGTGAV
               ||||||||||||||||:||||||||||:|||||||||:|||||::: ||::| | |: |:
orf114-1       KQPEYAYLKQLQVAKNVNWNQVQLAYDKWDYKQEGLTRAGAAIVTIIVTALTYGYGATAA
orf114a.pep    LGLNGA--------------XAAATD---------AAFASLASQASVSFINNKGDVGKTL 1477
                |: ::              :||||          ||:||| |||:||:|||||||||:|
orf114-1       GGVAASGSSTAAAAGTAATTTAAATTVSTATAMQTAALASLYSQAAVSIINNKGDVGKAL 1500
orf114a.pep    KELGRSSTVKNLVVAAATAGVADKIGA----------SALXNVSDKQWINNL----TVNL 1523
               |:|| |:|||::|::| |||: :::||          : | : : :| | ||    ::||
orf114-1       KDLGTSDTVKQIVTSALTAGALNQMGADIAQLNSKVRTELFSSTGNQTIANLGGRLATNL 1560
orf114a.pep    ANXGQCRTDX
               :| |
orf114-1       SNAGISAGINTAVN...
与脑膜炎奈瑟氏球菌的pspA推定分泌蛋白(登录号AF030941)的同源性
ORF114和pspA蛋白显示在302个重叠氨基酸内有36%的氨基酸相同性:
0rf114:1   AVAETANSQGKGKQAGSSVSVSL----KTSGDXXXXXXXXXXXXXXXXXXXXXXXPAHAQ 56
            AVAE  +  GK  Q   + SV +      S                         PA A
pspA:  19  AVAENVHRDGKSMQDSEAASVRVTGAASVSSARAAFGFRMAAFSVMLALGVAAFSPAPAS 78
0rf114:57  -ITTDKSAPKNQQVVILKTNTGAPLVNIQTPNGRGLSHNRXYAFDVDNKGAVLNNDRNN- 114
             I  DKSAPKNQQ VIL+T  G P VNIQTP+ +G+S NR   FDVD KG +LNN R+N
pspA:  79  GIIADKSAPKNQQAVILQTANGLPQVNIQTPSSQGVSVNRFKQFDVDEKGVILNNSRSNT 138
0rf114:115 ----------NPFVVKGSAQLILNEV-RGTASKLNGIVTVGGQKADVIIANPNGITVNGG 163
                      NP + +G A++I+N++     S LNG + VGG++A+V++ANP+GI VNGG
pspA:  139 QTQLGGWIQGNPHLARGEARVIVNQIDSSNPSLLNGYIEVGGKRAEVVVANPSGIRVNGG 198
0rf114:164 GFKNVGRGILTTGAPQIGKDGALTGFDVVKAHWTVXAAGWNDKGGAXYTGVLARAVALQG 223
            G  N     LT+G P +  +G LTGFDV      +   G  D   A YT +L+RA  +
pspA:  199 GLINAASVTLTSGVPVL-NNGNLTGFDVSSGKVVIGGKGL-DTSDADYTRILSRAAEINA 256
0rf114:224 KXXGKXLAVSTGPQKVDYASGEISAGTAAGTK----PTIALDTAALGGMYADSITLIANE 279
               GK + V +G  K+D+        +A  +     PT+A+DTA LGGMYAD ITLI+ +
pspA:  257 GVWGKDVKVVSGKNKLDFDGSLAKTASAPSSSDSVTPTVAIDTATLGGMYADKITLISTD 316
0rf114:280 KG 281
             G
DsDA:  317 NG 318
ORF114a也与pspAs同源:
gi|2623258(AF03D941)推定分泌蛋白[脑膜炎奈瑟氏球菌]长度=2273
评分=261bits(659),预计=3e-68
相同性=203/663(30%),阳性=314/663(46%),空隙=76/663(11%)
询问:1  MNKGLHRIIFSKKHSTMVAVAETANSQGKGKQAGSSVSVSLK-----TSGDXXXXXXXXX 55
          MNK  +++IF+KK S M+AVAE  +  GK  Q   + SV +      +S
目标:1  MNKRCYKVIFNKKRSCMMAVAENVHRDGKSMQDSEAASVRVTGAASVSSARAAFGFRMAA 60
询问:56 XXXXXXXXXXXXXXXXXXQITTDKSAPKNXQVVILKTNTGAPLVNIQTPNGRGLSHNRYT 115
                             I  DKSAPKN Q VIL+T  G P VNIQTP+ +G+S NR+
目标:61  FSVMLALGVAAFSPAPASGIIADKSAPKNQQAVILQTANGLPQVNIQTPSSQGVSVNRFK 120
询问:116 QFDVDNKGAVLNNDRNN-----------NPFLVKGSAQLILNEV-RGTASKLNGIVTVGG 163
           QFDVD KG +LNN R+N           NP L +G A++I+N++     S LNG + VGG
目标:121 QFDVDEKGVILNNSRSNTQTQLGGWIQGNPHLARGEARVIVNQIDSSNPSLLNGYIEVGG 180
询问:164 QKADVIIANPNGITVNGGGFKNVGRGILTIGAPQIGKDGALTGFDVRQGTLTVGAAGWND 223
           ++A+V++ANP+GI VNGGG  N     LT G P +  +G LTGFDV  G + +G G    D
目标:181 KRAEVVVANPSGIRVNGGGLINAASVTLTSGVPVL-NNGNLTGFDVSSGKVVIGGKGL-D 238
询问:224 KGGADYTGVLARAVALQGKLQGKNLAVSTGPQKVDYASGEISAGTAAGTK----PTIALD 279
              ADYT +L+RA  +   + GK++ V +G  K+D+        +A  +     PT+A+D
目标:239 TSDADYTRILSRAAEINAGVWGKDVKVVSGKNKLDFDGSLAKTASAPSSSDSVTPTVAID 298
询问:280 TAALGGMYADSITLIAXEKGVGVKNAGTLEAAK-QLIVTSSGRIENSGRIATTADGTEAS 338
           TA LGGMYAD ITLI+ + G  ++N G + AA   + +++ G++ NSG I       +A+
目标:299 TATLGGMYADKITLISTDNGAVIRNKGRIFAATGGVTLSADGKLSNSGSI-------DAA 351
询问:339 PTYLXIETTEKGAXGTFISNGGRIESKGLLVIETGEDIXLRNGAVVQNNGSRPATTVLNA 398
              +  +T +        +  G I S    V++  + I  + G +    GS     + +
目标:352 EITISAQTVD--------NRQGFIRSGKGSVLKVSDGINNQAGLI----GSAGLLDIRDT 399
询问:399 GHNLVIESKTNVNNAKGS----XNLSAGGRTTINDATIQAGSSVYSSTKGDTXLGENTRI 454
           G     +S  ++NN  G+     ++S   ++  ND  + A   V S +  D   G+
目标:400 G-----KSSLHINNTDGTIIAGKDVSLQAKSLDNDGILTAARDV-SVSLHDDFAGKRDIE 453
询问:455 IAENVTVLSNGSIGSAAVIEAKDTAHIESGKPLSLETSTVASNIRLNNGNIKGGKQLALL 514
               +T  + G + +  +I+A DT  + + +  +  +  + S  R       G     L+
目标:454 AGRTLTFSTQGRLKNTRIIQAGDTVSLTAAQIDNTVSGKIQSGNRTGLNGKNGITNRGLI 513
询问:515 ADDNIT-----AKTTNLNTPGNLYVHTGKDLNLNVDKDLSAASIHLKSDNAAHITGTSKT 569
             + IT     AK+ N  T G +Y   G  + +  D  L+          AA
目标:514 NSNGITLLQTEAKSDNAGT-GRIY---GSRVAVEADTLLNREETVNGETKAA-------V 562
询问:570 LTASKDMGVEAGXXXXXXXXXXXXSGNLHIQAA---KGNIQLRNTKL-NAAKALETTALQ 625
           + A + + + A             SG+LHI +A      +Q  NT L N + A+E++
目标:563 IAARERLDIGAREIENREAALLSSSGDLHIGSALNGSRQVQGANTSLHNRSAAIESS---619
询问:626 GNI 628
           GNI
目标:620 GNI 622
评分=37.5bits(85),预计=0.53
相同性=87/432(20%),阳性=159/432(36%),空隙=62/432(14%)
询问:239 LQGKLQGKNLAVSTGPQKVDYASGEISAGTAAGTKPTIALDTAALGGMYADSITLIAXEK 298
           LQG LQGKN+  + G    +  +G I A  A   K        A   + + S T     +
目标:1023 LQGDLQGKNIFAAAGSDITN--TGSIGAENALLLK--------ASNNIESRSETRSNQNE 1072
询问:299  GVGVKNAGTLEAAKQLIVTSSGRI--ENSGRIATTADGTEASPTYLXIETTEKGAXG-TF 355
               V+N G + A   L    +G +  +    I  TA            E T +   G T
目标:1073 QGSVRNIGRV-AGIYLTGRQNGSVLLDAGNNIVLTAS-----------ELTNQSEDGQTV 1120
询问:356  ISNGGRIESKGLLVIETGEDIXLRNGAVVQNNGSRPATTVLNAGHNLVIESK-------T  408
            ++ GG I S    +      I   +  V++   +   +T+   G NL + +K
目标:1121 LNAGGDIRSDTTGISRNQNTIFDSDNYVIRKEQNEVGSTIRTRG-NLSLNAKGDIRIRAA 1179
询问:409  NVNNAKGSXNLSAGGRTTINDATIQAGSS--------VYSSTKGDTXLGENTRIIAENVT 460
             V + +G   L+AG      D  ++AG +         Y+   G     + TR +
目标:1180 EVGSEQGRLKLAAG-----RDIKVEAGKAHTETEDALKYTGRSGGGIKQKMTRHLKNQNG 1234
询问:461  VLSNGSIGSAAVIEAKDTAHIESGKPLSLETSTVASNIRLNNGNIKGGKQLALLADDNIT 520
               +G++    +I         +G  +  +  T+ S    NN  +K  +  +  A+ N
目标:1235 QAVSGTLDGKEIILVSGRDITVTGSNIIADNHTILS--AKNNIVLKAAETRSRSAEMNKK 1292
询问:521  AKTTNLNTPG-NLYVHTGKDLNLNVDKDLSAASIHLKSDN-------AAHITGTSKTLTA 572
             K+  + + G      + KD   N  + +S     + S N         H T T  T+++
目标:1293 EKSGLMGSGGIGFTAGSKKDTQTNRSETVSHTESVVGSLNGNTLISAGKHYTQTGSTISS 1352
询问:573  SK-DMGVEAGXXXXXXXXXXXXSGNLHIQAAKG-----NIQLRNTKLNAAKALETTALQG 626
             + D+G+ +G              +  +   KG     ++ + NT + A  A++    G
目标:1353 PQGDVGISSGKISIDAAQNRYSQESKQVYEQKGVTVAISVPVVNTVMGAVDAVKAVQTVG 1412
询问:627  NIVSDGLHAVSA 638
               +  ++A++A
目标:1413 KSKNSRVNAMAA 1424
如上所述,将ORF114-1的氨基酸1-1423克隆到pGex载体中并在大肠杆菌中表达。用SDS-PAGE可以看到GST-融合物表达,图5显示了ORF114-1的亲水性曲线、抗原性指数和AMPHI区域。
根据这些结果,包括与脑膜炎奈瑟氏球菌的推定分泌蛋白同源以及存在一个跨膜结构域,预计脑膜炎奈瑟氏球菌的该蛋白及其表位可用作疫苗或诊断用的抗原。
实施例14
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 63>
1    ..CGCTTCATTC ATGATGAAGC AGTCGGCAGC AACATCGGCG GCGGCAAAAT
51     GATTGTTGCA GCCGGGCAGG ATATCAATGT ACGCGGCAnA AGCCTTATTT
101    CTGATAAGGG CATTGTTTTA AAAGCAGGAC ACGACATCGA TATTTCTACT
151    GCCCATAATC GCTATACCGG CAATGAATAC CACGAGAGCA wAAAwTCAGG
201    CGTCATGGGT ACTGGCGGAT TGGGCTTTAC TATCGGTAAC CGGAAAACTA
251    CCGATGACAC TGATCGTACC AATATTGTsC ATACAGGCAG CATTATAGGC
301    AGCCTGAaTG GAGACACCGT TACAGTTGCA GGAAACCGCT ACCGACAAAC
351    CGGCAGTACC GTCTCCAGCC CCGAGGGGCG CAATACCGTC ACAGCCAAAw
401    GCATAGATGT AGAGTTCGCA AACAACCGGT ATGCCACTGA CTACGcCCAT
451    ACCCA gGGAA CAAAAAGGCC TTACCGTCGC CCTCAATGTC CCGGTTGTCC
501    AAGCTGCACA AAACTTCATA CAAGCAGCCC AAAATGTGGG CAAAAGTAAA
551    AATAAACGCG TTAATGCCAT GGCTGCAGCC AATGCTGCAT GGCAGAGTTA
601    TCAAGCAACC CAACAAATGC AACAATTTGC TCCAAGCAGC AGTGCGGGAC
651    AAGGTCAAAA CTACAATCAA AGCCCCAGTA TCAGTGTGTC CATTAC.TAC
701    GGCGAACAGA AAAGTCGTAA CGAGCAAAAA AGACATTACA CCGAAgCGGC
751    AgCAAGTCAA ATTATCGGCA AAGGGCAAAC CACACTTGCG GCAACAGGAA
801    GTGGGGAGCA GTCCAATATC AATATTACAG GTTCCGATGT CATCGGCCAT
851    GCAGGTACTC C.CTCATTGC CGACAACCAT ATCAGACTCC AATCTGCCAA
901    ACAGGACGGC AGCGAGCAAA GCAAAAACAA AAGCAGTGGT TGGAATGCAG
951    GCGTACGTnn CAAAATAGGC AACGGCATCA GGTTTGGAAT TACCGCCGGA
1001   GGAAATATCG GTAAAGGTAA AGAGCAAGGG GGAAGTACTA CCCACCGCCA
1051   CACCCATGTC GGCAGCACAA CCGGCAAAAC TACCATCCGA AGCGGCGGG G
1101   GATACCACCC TCAAAGGTGT GCAGCTCATC GGCAAAGGCA TACAGGCAGA
1151   TACGCGCAAC CTGCATATAG AAAGTGTTCA AGATACTGAA ACCTATCAGA
1201   GCAAACAGCA AAACGGCAAT GTCCAAGTT t ACTGTCGGTT ACGGATTCAG
1251   TGCAAGCGGC AGTTACCGCC AAAGCAAAGT CAAAGCAGAC CATGCCTCCG
1301   TAACCGGGCA AAgCGGTATT TATGCCGGAG AAGACGGCTA TCAAATyAAA
1351   GTyAGAGACA ACACAGACCT yAAGGGCGGT ATCATCACGT CTAGCCAAAG
1401   CGCAGAAGAT AAGGGCAAAA ACCTTTTTCA GACGGCCACC CTTACTGCCA
1451   GCGACATTCA AAACCACAGC CGCTACGAAG GCAGAAGCTT CGGCATAGGC
1501   GGCAGTTTCG ACCTGAACGG CGGCTGGGAC GGCACGGTTA CCGACAAACA
1551   AGGCAGGCCT ACCGACAGGA TAAGCCCGGC AGCCGGCTAC GGCAGCGACG
1601   GAGACAGCAA AAACAGCACC ACCCGCAGCG GCGTCAACAC CCACAACATA
1651   CACATCACCG ACGAAGCGGG ACAACTTGCC CGAACAGGCA GGACTGCAAA
1701   AGAAACCGAA GCGCGTATCT ACACCGGCAT CGACACCGAA ACTGCGGATC
1751    AACACTCAGG CCATCTGAAA AACAGCTTCG AC...
它对应于氨基酸序列<SEQ ID 64;ORF116>:
1   ..RFIHDEAVGS NIGGGKMIVA AGQDINVRGX SLISDKGIVL KAGHDIDIST
51    AHNRYTGNEY HESXXSGVMG TGGLGFTIGN RKTTDDTDRT NIVHTGSIIG
101   SLNGDTVTVA GNRYRQTGST VSSPEGRNTV TAKXIDVEFA NNRYATDYAH
151   TQEQKGLTVA LNVPVVQAAQ NFIQAAQNVG KSKNKRVNAM AAANAAWQSY
201   QATQQMQQFA PSSSAGQGQN YNQSPSISVS IXYGEQKSRN EQKRHYTEAA
251   ASQIIGKGQT TLAATGSGEQ SNINITGSDV IGHAGTXLIA DNHIRLQSAK
301   QDGSEQSKNK SSGWNAGVRX KIGNGIRFGI TAGGNIGKGK EQGGSTTHRH
351   THVGSTTGKT TIRSGGDTTL KGVQLIGKGI QADTRNLHIE SVQDTETYQS
401   KQQNGNVQVT VGYGFSASGS YRQSKVKADH ASVTGQSGIY AGEDGYQIKV
451   RDNTDLKGGI ITSSQSAEDK GKNLFQTATL TASDIQNHSR YEGRSFGIGG
501   SFDLNGGWDG TVTDKQGRPT DRISPAAGYG SDGDSKNSTT RSGVNTHNIH
551   ITDEAGQLAR TGRTAKETEA RIYTGIDTET ADQHSGHLKN SFD...
该氨基酸序列的计算机分析给出了下列结果:
与脑膜炎奈瑟氏球菌pspA推定分泌蛋白(登录号AF030941)的同源性
ORF116和pspA蛋白显示在502个重叠的氨基酸内有38%的氨基酸相同性:
0rf116:6     EAVGSNIGGGKMIVAAGQDINVRGXSLISDKGIVLKAGHDIDISTAHNRYTGNEYHESXX 65
              +AV   + G ++I+ +G+DI V G ++I+D  +L  A ++I +  A  R    E ++
PspA:1 235   QAVSGTLDGKEIILVSGRDITVTGSNIIADNHTILSAKNNIVLKAAETRSRSAEMNKKEK 1294
0rf1 16:66   XXXXXXXXXXXXXXNRKXXXXXXRTNIVHTGSIIGSLNGDTVTVAGNRYRQTGSTVSSPE 125
                            ++K         +HT  S++GSLNG+T+  AG  Y QTGST+SSP+
PspA:1295    SGLMGSGGIGFTAGSKKDTQTNRSETVSHTESVVGSLNGNTLISAGKHYTQTGSTISSPQ 1354
0rf116:126   GRNTVTAKXIDVEFANNRYATDYAHTQEQKGLTVALNVPXXXX---XXXXXXXXXXXGKS 182
              G   +++  I ++ A NRY+ +     EQKG+TVA++VP                  GKS
PspA:1355    GDVGISSGKISIDAAQNRYSQESKQVYEQKGVTVAISVPVVNTVMGAVDAVKAVQTVGKS 1414
0rf116:183   KNKRYXXXXXXXXXWQSYQATQQMQQFA--PSSSAGQGQNYNQSPSISVSIXYGEQKSRN 240
              KN RV          +   +   +   A  P  +AGQG        ISVS+ YGEQK+ +
PspA:1415    KNSRVNAMAAANALNKGVDSGVALYNAARNPKKAAGQG--------ISVSVTYGEQKNTS 1466
0rf116:241   EQKRHYTEAAASQIIGKGQTTLAATGSGEQSNINITGSDVIGHAGTXLIADNHIRLQSAK 300
              E+    T+    +I G G+ +L A+G+G+ S I ITGSDV G  GT L A+N +++++A+
PspA:1467    ESRIKGTQVQEGKITGGGKVSLTASGAGKDSRITITGSDVYGGKGTRLKAENAVQIEAAR 1526
0rf116:301   QDGSEQSKNKSSGWNAGVRXKIGNGIRFGITAXXXXXXXXXXXXSTTHRHTHVGSTTGKT 360
              Q   E+S+NKS+G+NAGV   I  GI FG TA             T +R++H+GS   +T
PspA:1527    QTHQERSENKSAGFNAGVAIAINKGISFGFTAGANYGKGYGNGDETAYRNSHIGSKDSQT 1586
0rf116:361   TIRSGGDTTLKGVQLIGKGIQADTRNLHIESVQDTETYQSKQQNGNVQVTVGYGFSASGS 420
               I SGGDT +KG QL GKG+     +LHIES+QDT  ++ KQ+N + QVTVGYGFS  GS
PspA:1587    AIESGGDTVIKGGQLKGKGVGVTAESLHIESLQDTAVFKGKQENVSAQVTVGYGFSVGGS 1646
0rf116:421   YRQSKVKADHASVTGQSGIYAGEDGYQIKVRDNTDLKGGIITSSQSAEDKGKNLFQTATL 480
              Y +SK  +D+ASV  QSGI+AG DGY+I+V   T L G  + S     DK KNL +T+ +
PspA:1647    YNRSKSSSDYASVNEQSGIFAGGDGYRIRVNGKTGLVGAAVVSD---ADKSKNLLKTSEI 1703
0rf116:481   TASDIQNHSRYEGRSFGIGGSF 502
                 DIQNH+     + G+ G F
PspA:1704    WHKDIQNHASAAASALGLSGGF 1725
根据与pspA的同源性,预计脑膜炎奈瑟氏球菌的该蛋白及其表位可用作疫苗或诊断用的抗原。
实施例15
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 65>
1  ..ACGACCGGCA GCCTCGGCGG CATACTGGCC GGCGGCGGCA CTTCCCTTGC
51   CGCACCGTAT TTGGACAAAG CGGCGGAAAA CCTCGGTCCG GCGGGCAAAG
101  CGGCGGTCAA CGCACTGGGC GGTGCGGCCA TCGGCTATGC AACTGGTGGT
151  AGTGGTGGTG CTGTGGTGGG TGCGAATGTA GATTGGAACA ATAGGCAGCT
201  GCATCCGAAA GAAATGGCGT TGGCCGACAA ATATGCCGAA GCCCTCAAGC
251  GCGAAGTTGA AAAACGCGAA GGCAGAAAAA TCAGCAGCCA AGAAGCGGCA
301  ATGAGAATCC GCAGGCAGAT ATGCGTTGGG TGGACAAAGG TTCCCAAGAC
351  GGCTATACCG ACCAAAGCGT CATATCCCTT ATCGGAATGA
它对应于氨基酸序列<SEQ ID 66;ORF 118>:
1   ..T TGSLGGILA GGGTSLAAPY LDKAAENLGP AGKAAVN ALG GAAIGYATGG
51    SGGAVVGANV DWNNRQLHPK EMALADKYAE ALKREVEKRE GRKISSQEAA
101   MRIRRQICVG WTKVPKTAIP TKASYPLSE*
该氨基酸序列的计算机分析揭示了两个推定的跨膜结构域。
根据该分析,预计脑膜炎奈瑟氏球菌的该蛋白及其表位可用作疫苗或诊断用的抗原。
实施例16
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 67>
1    ..CAATGCCGTC TGAAAAGCTC ACAATTTTAC AGACGGCATT TGTTATGCAA
51     GTACATATAC AGATTCCCTA TATACTGCCC AGrkGCGTGC GTgGCTGAAG
101    ACACCCCCTA CGCTTGCTAT TTGrAACAGC TCCAAGTCAC CAAAGACGTC
151    AACTGGAACC AGGTACwACT GGCGTACGAC AAATGGGACT ATAAACAGGA
201    AGGCTTAACC GGAGCCGGAG CAGCGATTAT TGCGCTGGCT GTTACCGTGG
251    TTACTGCGGG CGCGGGAgCC GGAGCCGCAC TGGGcTTAAA CGGCGCGGCc
301    GCAGCGGCAA CCGATGCCGC ATTCGCCTCG CTGGCCAGCC AGGcTTCCGT
351    ATCGCTCATC AaCAACAAAG GCAATATCGG TAaCACCCTG AAAGAGCTGG
401    GCAGAAGCAG CACGGTGAAA AATCTGATGG TTGCCGTCGc tACCGCAgGC
451    GTagCcgaCA AAATCGGTGC TTCGGCACTG AACAATGTCA GCGATAAGCA
501    GTGGATCAAC AACCTGACCG TCAACCTGGC CAATGCGGGC AGTGCCGCAC
551    TGATTAATAC CGCTGTCAAC GGCGGCAGCc tgAAAGACAA TCTGGAAGCG
601    AATATCCTTG CGGCTTTGGT GAATACTGCG CATGGAGAAG CAGCCAGTAA
651    AATCAAACAG TTGGATCAGC ACTACATTAC CCACAAGATT GCCCaTGCCA
701    TAGCGGGCTG TGCGGcTGCG GCGGCGAATA AGGGCAAGTG TCAGGATGGT
751    GCGATAgGTG CGGCTGTGGG CGAGATAGTC GGGGAgGCTT TGACAAACGG
801    CAAAAATCCT GACACTTTGA CAGCTAAAgA ACGCGaACAG ATTTTGGCAT
851    ACAGCAAACT GGTTGCCGGT ACGGTAAGCG GTGTGGTCGG CGGCGATGTA
901    AATGCGGCGG CGAATGCGGC TGAGGTAGCG GTGAAAAATA ATCAGCTTAG
951    CGACAAAtGA
它对应于氨基酸序列<SEQ ID 68;ORF41>:
1    ..QCRLKSSQFY RRHLLCKYIY RFPIYCPXAC VAEDTPYACY LXQLQVTKDV
51     NWNQVXLAYD KWDYKQEG LT GAGAAIIALA VTVVTAGAGA GAALGLNGAA
101    AAATDAAFAS LASQASVSLI NNKGNIGNTL KELGRSSTVK NLMVAVATAG
151    VADKIGASAL NNVSDKQWIN NLTVNLANAG SAALINTAVN GGSLKDNLEA
201    NILAALVNTA HGEAASKIKQ LDQHYITHKI AHAIAGCAAA AANKGKCQDG
251    AIGAAVGEIV GEALTNGKNP DTLTAKEREQ ILAYSKLVAG TVSGVVGGDV
301    NAAANAAEVA VKNNQLSDK*
进一步的工作揭示了完整的核苷酸序列<SEQ ID 69>:
1     ATGCAAGTAA ATATTCAGAT TCCCTATATA CTGCCCAGAT GCGTGCGTGC
51    TGAAGACACC CCCTACGCTT GCTATTTGAA ACAGCTCCAA GTCACCAAAG
101   ACGTCAACTG GAACCAGGTA CAACTGGCGT ACGACAAATG GGACTATAAA
151   CAGGAAGGCT TAACCGGAGC CGGAGCAGCG ATTATTGCGC TGGCTGTTAC
201   CGTGGTTACT GCGGGCGCGG GAGCCGGAGC CGCACTGGGC TTAAACGGCG
251   CGGCCGCAGC GGCAACCGAT GCCGCATTCG CCTCGCTGGC CAGCCAGGCT
301   TCCGTATCGC TCATCAACAA CAAAGGCAAT ATCGGTAACA CCCTGAAAGA
351   GCTGGGCAGA AGCAGCACGG TGAAAAATCT GATGGTTGCC GTCGCTACCG
401   CAGGCGTAGC CGACAAAATC GGTGCTTCGG CACTGAACAA TGTCAGCGAT
451   AAGCAGTGGA TCAACAACCT GACCGTCAAC CTGGCCAATG CGGGCAGTGC
501   CGCACTGATT AATACCGCTG TCAACGGCGG CAGCCTGAAA GACAATCTGG
551   AAGCGAATAT CCTTGCGGCT TTGGTGAATA CTGCGCATGG AGAAGCAGCC
601   AGTAAAATCA AACAGTTGGA TCAGCACTAC ATTACCCACA AGATTGCCCA
651   TGCCATAGCG GGCTGTGCGG CTGCGGCGGC GAATAAGGGC AAGTGTCAGG
701   ATGGTGCGAT AGGTGCGGCT GTGGGCGAGA TAGTCGGGGA GGCTTTGACA
751   AACGGCAAAA ATCCTGACAC TTTGACAGCT AAAGAACGCG AACAGATTTT
801   GGCATACAGC AAACTGGTTG CCGGTACGGT AAGCGGTGTG GTCGGCGGCG
851   ATGTAAATGC GGCGGCGAAT GCGGCTGAGG TAGCGGTGAA AAATAATCAG
901   CTTAGCGACA AAGAGGGTAG AGAATTTGAT AACGAAATGA CTGCATGCGC
951   CAAACAGAAT AATCCTCAAC TGTGCAGAAA AAATACTGTA AAAAAGTATC
1001  AAAATGTTGC TGATAAAAGA CTTGCTGCTT CGATTGCAAT ATGTACGGAT
1051  ATATCCCGTA GTACTGAATG TAGAACAATC AGAAAACAAC ATTTGATCGA
1101  TAGTAGAAGC CTTCATTCAT CTTGGGAAGC AGGTCTAATT GGTAAAGATG
1151  ATGAATGGTA TAAATTATTC AGCAAATCTT ACACCCAAGC AGATTTGGCT
1201  TTACAGTCTT ATCATTTGAA TACTGCTGCT AAATCTTGGC TTCAATCGGG
1251  CAATACAAAG CCTTTATCCG AATGGATGTC CGACCAAGGT TATACACTTA
1301  TTTCAGGAGT TAATCCTAGA TTCATTCCAA TACCAAGAGG GTTTGTAAAA
1351  CAAAATACAC CTATTACTAA TGTCAAATAC CCGGAAGGCA TCAGTTTCGA
1401  TACAAACCTA AAAAGACATC TGGCAAATGC TGATGGTTTT AGTCAAAAAC
1451  AGGGCATTAA AGGAGCCCAT AACCGCACCA ATTTTATGGC AGAACTAAAT
1501  TCACGAGGAG GACGCGTAAA ATCTGAAACC CAAACTGATA TTGAAGGCAT
1551  TACCCGAATT AAATATGAGA TTCCTACACT AGACAGGACA GGTAAACCTG
1601  ATGGTGGATT TAAGGAAATT TCAAGTATAA AAACTGTTTA TAATCCTAAA
1651  AAATTTTCTG ATGATAAAAT ACTTCAAATG GCTCAAAATG CTGCTTCACA
1701  AGGATATTCA AAAGCCTCTA AAATTGCTCA AAATGAAAGA ACTAAATCAA
1751  TATCGGAAAG AAAAAATGTC ATTCAATTCT CAGAAACCTT TGACGGAATC
1801  AAATTTAGAT CATATTTTGA TGTAAATACA GGAAGAATTA CAAACATTCA
1851  CCCAGAATAA
它对应于氨基酸序列<SEQ ID 70;ORF41-1>:
1    MQVNIQIPYI LPRCVRAEDT PYACYLKQLQ VTKDVNWNQV QLAYDKWDYK
51   QEGLTG AGAA IIALAVTVVT AGAGAGAALG LNGAAAAATD AAFASLASQA
101  SVSLINNKGN IGNTLKELGR SSTVKNLMVA VATAGVADKI GASALNNVSD
151  KQWINNLTVN LANAGSAALI NTAVNGGSLK DNLEANILAA LVNTAHGEAA
201  SKIKQLDQHY ITHKIAHAIA GCAAAAANKG KCQDGAIGAA VGEIVGEALT
251  NGKNPDTLTA KEREQILAYS KLVAGTVSGV VGGDVNAAAN AAEVAVKNNQ
301  LSDKEGREFD NEMTACAKQN NPQLCRKNTV KKYQNVADKR LAASIAICTD
351  ISRSTECRTI RKQHLIDSRS LHSSWEAGLI GKDDEWYKLF SKSYTQADLA
401  LQSYHLNTAA KSWLQSGNTK PLSEWMSDQG YTLISGVNPR FIPIPRGFVK
451  QNTPITNVKY PEGISFDTNL KRHLANADGF SQKQGIKGAH NRTNFMAELN
501  SRGGRVKSET QTDIEGITRI KYEIPTLDRT GKPDGGFKEI SSIKTVYNPK
551  KFSDDKILQM AQNAASQGYS KASKIAQNER TKSISERKNV IQFSETFDGI
601  KFRSYFDVNT GRITNIHPE*
该氨基酸序列的计算机分析预计了一个跨膜结构域,并且还发现与脑膜炎奈瑟氏球菌(菌株A)的ORF的同源性。
ORF41显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF41a)重叠的279个氨基酸内有92.8%的相同性:
            10        20        30        40        50        60       69
orf41.pep    YRRHLLCKYIYRFPIYCPXACVAEDTPYACYLXQLQVTKDVNWNQVXLAYDKWDYKQEGL
                                           || ||||:|::||||| ||||:||||||||
orf41a                                    YLKQLQVAKNINWNQVQLAYDRWDYKQEGL
                                                  10        20        30
           70        80        90       100       110       120      129
orf41.pep   TG AGAAIIALAVTVVTAGAGAGAALGLNGAAAAATDAAFASLASQASVSLINNKGNIGNT
            |  ||||||||||||||:|| |:||:|||||| ||||||||||||||||||:|||||::|:|
orf41a      TE AGAAIIALAVTVVTSGAGTGAVLGLNGAXAAATDAAFASLASQASVSFINNKGDVGKT
                    40        50        60        70        80        90
          130       140       150       160       170       180      189
orf41.pep   LKELGRSSTVKNLMVAVATAGVADKIGASALNNVSDKQWINNLTVNLANAGSAALINTAV
            |||||||||||||:||:|||||||||||||| ||||||||||||||||||||||||||||
orf41a      LKELGRSSTVKNLVVAAATAGVADKIGASALXNVSDKQWINNLTVNLANAGSAALINTAV
                   100       110       120       130       140       150
          190        200      210       220       230       240      249
orf41.pep   NGGSLKDNLEANILAALVNTAHGEAASKIKQLDQHYITHKIAHAIAGCAAAAANKGKCQD
            ||||||| |||||||||||||||||||||||||||||:||||||||||||||||||||||
orf41a      NGGSLKDXLEANILAALVNTAHGEAASKIKQLDQHYIVHKIAHAIAGCAAAAANKGKCQD
                   160       170       180       190       200       210
          250       260       270       280       290       300      309
orf41.pep   GAIGAAVGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVSGVVGGDVNAAANAAEV
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf41a      GAIGAAVGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVSGVVGGDVNAAANAAEV
                   220       230       240       250       260       270
          310       320
orf41.pep   AVKNNQLSDKX
            |||||||||
orf41a      AVKNNQLSDXEGREFDNEMTACAKQNXPQLCRKNTVKKYQNVADKRLAASIAICTDISRS
                   280       290       300       310       320       330
ORF41a的部分核苷酸序列是<SEQ ID 71>:
1    ..TATCTGAAAC AGCTCCAAGT AGCGAAAAAC ATCAACTGGA ATCAGGTGCA
51     GCTTGCTTAC GACAGATGGG ACTACAAACA GGAGGGCTTA ACCGAAGCAG
101    GTGCGGCGAT TATCGCACTG GCCGTTACCG TGGTCACCTC AGGCGCAGGA
151    ACCGGAGCCG TATTGGGATT AAACGGTGCG NCCGCCGCCG CAACCGATGC
201    AGCATTCGCC TCTTTGGCCA GCCAGGCTTC CGTATCGTTC ATCAACAACA
251    AAGGCGATGT CGGCAAAACC CTGAAAGAGC TGGGCAGAAG CAGCACGGTG
301    AAAAATCTGG TGGTTGCCGC CGCTACCGCA GGCGTAGCCG ACAAAATCGG
351    CGCTTCGGCA CTGANCAATG TCAGCGATAA GCAGTGGATC AACAACCTGA
401    CCGTCAACCT AGCCAATGCG GGCAGTGCCG CACTGATTAA TACCGCTGTC
451    AACGGCGGCA GCCTGAAAGA CANTCTGGAA GCGAATATCC TTGCGGCTTT
501    GGTCAATACC GCGCATGGAG AAGCAGCCAG TAAAATCAAA CAGTTGGATC
551    AGCACTACAT AGTCCACAAG ATTGCCCATG CCATAGCGGG CTGTGCGGCA
601    GCGGCGGCGA ATAAGGGCAA GTGTCAGGAT GGTGCGATAG GTGCGGCTGT
651    GGGCGAGATA GTCGGGGAGG CTTTGACAAA CGGCAAAAAT CCTGACACTT
701    TGACAGCTAA AGAACGCGAA CAGATTTTGG CATACAGCAA ACTGGTTGCC
751    GGTACGGTAA GCGGTGTGGT CGGCGGCGAT GTAAATGCGG CGGCGAATGC
801    GGCTGAGGTA GCGGTGAAAA ATAATCAGCT TAGCGACNAA GAGGGTAGAG
851    AATTTGATAA CGAAATGACT GCATGCGCCA AACAGAATAN TCCTCAACTG
901    TGCAGAAAAA ATACTGTAAA AAAGTATCAA AATGTTGCTG ATAAAAGACT
951    TGCTGCTTCG ATTGCAATAT GTACGGATAT ATCCCGTAGT ACTGAATGTA
1001   GAACAATCAG AAAACAACAT TTGATCGATA GTAGAAGCCT TCATTCATCT
1051   TGGGAAGCAG GTCTAATTGG TAAAGATGAT GAATGGTATA AATTATTCAG
1101   CAAATCTTAC ACCCAAGCAG ATTTGGCTTT ACAGTCTTAT CATTTGAATA
1151   CTGCTGCTAA ATCTTGGCTT CAATCGGGCA ATACAAAGCC TTTATCCGAA
1201   TGGATGTCCG ACCAAGGTTA TACACTTATT TCAGGAGTTA ATCCTAGATT
1251   CATTCCAATA CCAAGAGGGT TTGTAAAACA AAATACACCT ATTACTAATG
1301   TCAAATACCC GGAAGGCATC AGTTTCGATA CAAACCTANA AAGACATCTG
1351    GCAAATGCTG ATGGTTTTAG TCAAGAACAG GGCATTAAAG GAGCCCATAA
1401    CCGCACCAAT NTTATGGCAG AACTAAATTC ACGAGGAGGA NGNGTAAAAT
1451    CTGAAACCCA NACTGATATT GAAGGCATTA CCCGAATTAA ATATGAGATT
1501    CCTACACTAG ACAGGACAGG TAAACCTGAT GGTGGATTTA AGGAAATTTC
1551    AAGTATAAAA ACTGTTTATA ATCCTAAAAA NTTTTNNGAT GATAAAATAC
1601    TTCAAATGGC TCAANATGCT GNTTCACAAG GATATTCAAA AGCCTCTAAA
1651    ATTGCTCAAA ATGAAAGAAC TAAATCAATA TCGGAAAGAA AAAATGTCAT
1701    TCAATTCTCA GAAACCTTTG ACGGAATCAA ATTTAGANNN TATNTNGATG
1751    TAAATACAGG AAGAATTACA AACATTCACC CAGAATAA
它编码的蛋白质具有部分氨基酸序列<SEQ ID 72>:
1    YLKQLQVAKN INWNQVQLAY DRWDYKQEGL TE AGAAIIAL AVTVVTSGAG
51   TGAVLGLNGA XAAATDAAFA SLASQASVSF INNKGDVGKT LKELGRSSTV
101  KNLVVAAATA GVADKIGASA LXNVSDKQWI NNLTVNLANA GSAALINTAV
151  NGGSLKDXLE ANILAALVNT AHGEAASKIK QLDQHYIVHK IAHAIAGCAA
201  AAANKGKCQD GAIGAAVGEI VGEALTNGKN PDTLTAKERE QILAYSKLVA
251  GTVSGVVGGD VNAAANAAEV AVKNNQLSDX EGREFDNEMT ACAKQNXPQL
301  CRKNTVKKYQ NVADKRLAAS IAICTDISRS TECRTIRKQH LIDSRSLHSS
351  WEAGLIGKDD EWYKLFSKSY TQADLALQSY HLNTAAKSWL QSGNTKPLSE
401  WMSDQGYTLI SGVNPRFIPI PRGFVKQNTP ITNVKYPEGI SFDTNLXRHL
451  ANADGFSQEQ GIKGAHNRTN XMAELNSRGG XVKSETXTDI EGITRIKYEI
501  PTLDRTGKPD GGFKEISSIK TVYNPKXFXD DKILQMAQXA XSQGYSKASK
551  IAQNERTKSI SERKNVIQFS ETFDGIKFRX YXDVNTGRIT NIHPE*
ORF41a和ORF41-1显示在595个重叠的氨基酸内有94.8%的相同性:
                                           10        20        30
orf41a.pep                         YLKQLQVAKNINWNQVQLAYDRWDYKQEGLTEAGAA
                                   |||||||:|::||||||||||:||||||||| ||||
orf41-1    MQVNIQIPYILPRCVRAEDTPYACYLKQLQVTKDVNWNQVQLAYDKWDYKQEGLTGAGAA
                   10        20        30        40        50        60
             40        50        60        70        80        90
orf41a.pep IIALAVTVVTSGAGTGAVLGLNGAXAAATDAAFASLASQASVSFINNKGDVGKTLKELGR
           ||||||||||:|||:||:|||||| ||||||||||||||||||:|||||::|:|||||||
orf41-1    IIALAVTVVTAGAGAGAALGLNGAAAAATDAAFASLASQASVSLINNKGNIGNTLKELGR
                   70        80        90       100       110       120
            100       110       120       130       140       150
orf41a.pep SSTVKNLVVAAATAGVADKIGASALXNVSDKQWINNLTVNLANAGSAALINTAVNGGSLK
           |||||||:||:|||||||||||||| ||||||||||||||||||||||||||||||||||
orf41-1    SSTVKNLMVAVATAGVADKIGASALNNVSDKQWINNLTVNLANAGSAALINTAVNGGSLK
                  130       140       150       160       170       180
            160       170       180       190       200       210
orf41a.pep DXLEANILAALVNTAHGEAASKIKQLDQHYIVHKIAHAIAGCAAAAANKGKCQDGAIGAA
           | |||||||||||||||||||||||||||||:||||||||||||||||||||||||||||
orf41-1    DNLEANILAALVNTAHGEAASKIKQLDQHYITHKIAHAIAGCAAAAANKGKCQDGAIGAA
                  190       200       210       220       230       240
            220       230       240       250       260        270
orf41a.pep VGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVSGVVGGDVNAAANAAEVAVKNNQ
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf41-1    VGEIVGEALTNGKNPDTLTAKEREQILAYSKLVAGTVSGVVGGDVNAAANAAEVAVKNNQ
                  250       260       270       280       290       300
            280       290       300       310       320       330
orf41a.pep LSDXEGREFDNEMTACAKQNXPQLCRKNTVKKYQNVADKRLAASIAICTDISRSTECRTI
           ||| |||||||||||||||| |||||||||||||||||||||||||||||||||||||||
orf41-1    LSDKEGREFDNEMTACAKQNNPQLCRKNTVKKYQNVADKRLAASIAICTDISRSTECRTI
                  310       320       330       340       350       360
               340       350       360       370       380       390
orf41a.pep    RKQHLIDSRSLHSSWEAGLIGKDDEWYKLFSKSYTQADLALQSYHLNTAAKSWLQSGNTK
              ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf41-1       RKQHLIDSRSLHSSWEAGLIGKDDEWYKLFSKSYTQADLALQSYHLNTAAKSWLQSGNTK
                     370       380       390       400       410       420
               400       410       420       430       440       450
orf41a.pep    PLSEWMSDQGYTLISGVNPRFIPIPRGFVKQNTPITNVKYPEGISFDTNLXRHLANADGF
              |||||||||||||||||||||||||||||||||||||||||||||||||| |||||||||
orf41-1       PLSEWMSDQGYTLISGVNPRFIPIPRGFVKQNTPITNVKYPEGISFDTNLKRHLANADGF
                     430       440       450       460       470       480
               460       470       480       490       500       510
orf41a.pep    SQEQGIKGAHNRTNXMAELNSRGGXVKSETXTDIEGITRIKYEIPTLDRTGKPDGGFKEI
              ||:||||||||||| ||||||||| |||||| ||||||||||||||||||||||||||||
orf41-1       SQKQGIKGAHNRTNFMAELNSRGGRVKSETQTDIEGITRIKYEIPTLDRTGKPDGGFKEI
                     490       500       510       520       530       540
               520       530       540       550       560       570
orf41a.pep    SSIKTVYNPKXFXDDKILQMAQXAXSQGYSKASKIAQNERTKSISERKNVIQFSETFDGI
              |||||||||| | ||||||||| | |||||||||||||||||||||||||||||||||||
orf41-1       SSIKTVYNPKKFSDDKILQMAQNAASQGYSKASKIAQNERTKSISERKNVIQFSETFDGI
                     550       560       570       580       590       600
               580       590
orf4 1a.pep   KFRXYXDVNTGRITNIHPEX
              ||| | ||||||||||||||
orf41-1       KFRSYFDVNTGRITNIHPEX
                     610       620
如上所述扩增ORF41-1的氨基酸25-619。图6显示了ORF41-1的亲水性曲线、抗原性指数和AMPHI区域。
根据该分析,预计脑膜炎奈瑟氏球菌的该蛋白及其表位可用作疫苗或诊断用的抗原。
实施例17
在脑膜炎奈瑟氏球菌中鉴定出下列DNA序列<SEQ ID 73>
1    ATGGCAATCA TTACATTGTA TTATTCTGTC AATGGTATTT TAAATGTATG
51   TGCAAAAGCA AAAAATATTC AAGTAGTTGC CAATAATAAG AATATGGTTC
101  TTTTTGGGTT TTTGGsmrGC ATCATCGGCG GTTCAACCAA TGCCATGTCT
151  CCCATATTGT TAATATTTTT GCTTAGCGAA ACAGAAAATA AAAATcgTAT
201  CGTAAAATCA AGCAATCTAT GCTATCTTTT GGCGAAAATT GTTCAAATAT
251  ATATGCTAAG AGACCAGTAT TGGTTATTAA ATAAGAGTGA ATACGdTTTA
301  ATATTTTTAC TGTCCGTATT GTCTGTTATT GGATTGTATG TTGGAATTCG
351  GTTAAGGACT AAGATTAGCC CAaATTTTTT TAAAATGTTA ATTTTTATTG
401  tTTTATTGGT ATTGGCtCTG AAAATCGGGC AttCGGGTTT AAtCAAACTT
451  TAA
它对应于氨基酸序列<SEQ ID 74;ORF51>:
1    MAIITLYYSV NGILNVCAKA KNIQVVANNK NMVLFG FLXX IIGGSTNAMS
51   PILLIFLLSE TENKNRIVKS SNLCYLLAKI VQIYMLRDQY WLLNKS EYXL
101  IFLLSVLSVI GLYVGIRLRT KI SPNFFKML IFIVLLVLAL KIGHSGLIKL
151  *
进一步的工作揭示了完整的核苷酸序列<SEQ ID 75>:
1    ATGCAAGAAA TAATGCAATC TATCGTTTTT GTTGCTGCCG CAATACTGCA
51   CGGAATTACA GGCATGGGAT TTCCGATGCT CGGTACAACC GCATTGGCTT
101  TTATCATGCC ATTGTCTAAG GTTGTTGCCT TGGTGGCATT ACCAAGCCTG
151  TTAATGAGCT TGTTGGTTCT ATGCAGCAAT AACAAAAAGG GTTTTTGGCA
201  AGAGATTGTT TATTATTTAA AAACCTATAA ATTGCTTGCT ATCGGCAGCG
251  TCGTTGGCAG CATTTTGGGG GTGAAGTTGC TTTTGATACT TCCAGTGTCT
301  TGGCTGCTTT TACTGATGGC AATCATTACA TTGTATTATT CTGTCAATGG
351  TATTTTAAAT GTATGTGCAA AAGCAAAAAA TATTCAAGTA GTTGCCAATA
401  ATAAGAATAT GGTTCTTTTT GGGTTTTTGG CAGGCATCAT CGGCGGTTCA
451  ACCAATGCCA TGTCTCCCAT ATTGTTAATA TTTTTGCTTA GCGAAACAGA
501  AAATAAAAAT CGTATCGTAA AATCAAGCAA TCTATGCTAT CTTTTGGCGA
551  AAATTGTTCA AATATATATG CTAAGAGACC AGTATTGGTT ATTAAATAAG
601  AGTGAATACG GTTTAATATT TTTACTGTCC GTATTGTCTG TTATTGGATT
651  GTATGTTGGA ATTCGGTTAA GGACTAAGAT TAGCCCAAAT TTTTTTAAAA
701  TGTTAATTTT TATTGTTTTA TTGGTATTGG CTCTGAAAAT CGGGCATTCG
751  GGTTTAATCA AACTTTAA
它对应于氨基酸序列<SEQ ID 76;ORF5 1-1>:
1    MQEIMQSIVF VAAAILHGIT GMGFPMLGTT ALAFIMPLSK V VALVALPSL
51   LMSLLVLCSN NKKGFWQEIV YYLKTYKLLA IGSVVGSILG VK LLLILPVS
101  WLLLLMAIIT LYYSVNGILN VCAKAKNIQV VANNKNMVLF GFLAG IIGGS
151  TNAMSPILLI FLLSETENKN RIVKSSNLCY LLAKIVQIYM LRDQYWLLNK
201  SEYG LIFLLS VLSVIGLYVG IRLRTKISPN  FFKMLIFIVL LVLALKIGHS
251  GLIKL*
该氨基酸序列的计算机分析揭示了三个推定的跨膜结构域。还鉴定了一个脑膜炎奈瑟氏球菌菌株A的相应ORF:
与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性
ORF51显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF51a)重叠的150个氨基酸内有96.7%的相同性:
                                                 10        20        30
orf51.pep                                 MAIITLYYSVNGILNVCAKAKNIQVVANNK
                                          |||| ||||||||||||||||||||||||||
orf51a     YKLLAIGSVVGSILGVK LLLILPVSWLLLLMAIITLYYSVNGILNVCAKAKNIQVVANNK
              80        90       100       110       120       130
                   40        50        60        70        80        90
orf51.pep  NMVLFGFLXX IIGGSTNAMSPILLIFLLSETENKNRIVKSSNLCYLLAKIVQIYMLRDQY
           ||||||||   ||||||||||||||||| ||||||||||:||||||||||||||||||||||
orf51a     NMVLFGFLAG IIGGSTNAMSPILLIFLLSETENKNRIAKSSNLCYLLAKIVQIYMLRDQY
             140       150       160       170       180       190
                  100       110       120       130       140       150
orf51.pep  WLLNKSEYX LIFLLSVLSVIGLYVGIRLRTKISPN FFKMLIFIVLLVLALKIGHSGLIKL
           ||||||||  ||||||||||||||||| ||||||||| ||||||||||||||||| |:||||||
orf51a     WLLNKSEYG LIFLLSVLSVIGLYVGIRLRTKISPN FFKMLIFIVLLVLALKIGYSGLIKL
             200       210       220       230       240       250
ORF51-1和ORF51a显示在255个重叠的氨基酸内有99.2%的相同性:
orf51a.pep MQEIMQSIVFVAAAILHGITGMGFPMLGTTALAFIMPLSKVVALVALPSLLMSLLVLCSN
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf51-1    MQEIMQSIVFVAAAILHGITGMGFPMLGTTALAFIMPLSKVVALVALPSLLMSLLVLCSN
orf51a.pep NKKGFWQEIVYYLKTYKLLAIGSVVGSILGVKLLLILPVSWLLLLMAIITLYYSVNGILN
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf51-1    NKKGFWQEIVYYLKTYKLLAIGSVVGSILGVKLLLILPVSWLLLLMAIITLYYSVNGILN
orf51a.pep VCAKAKNIQVVANNKNMVLFGFLAGIIGGSTNAMSPILLIFLLSETENKNRIAKSSNLCY
           ||||||||||||||||||||||||||||||||||||||||||||||||||||:|||||||
orf51-1     VCAKAKNIQVVANNKNMVLFGFLAGIIGGSTNAMSPILLIFLLSETENKNRIVKSSNLCY
orf51a.pep  LLAKIVQIYMLRDQYWLLNKSEYGLIFLLSVLSVIGLYVGIRLRTKISPNFFKMLIFIVL
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf51-1     LLAKIVQIYMLRDQYWLLNKSEYGLIFLLSVLSVIGLYVGIRLRTKISPNFFKMLIFIVL
orf51a.pep  LVLALKIGYSGLIKLX
            ||||||||:|||||||
orf51-1     LVLALKIGHSGLIKLX
全长ORF51a的核苷酸序列是<SEQ ID 77>:
1    ATGCAAGAAA TAATGCAATC TATCGTTTTT GTTGCTGCCG CAATACTGCA
51   CGGAATTACA GGCATGGGAT TTCCGATGCT CGGTACAACC GCATTGGCTT
101  TTATCATGCC ATTGTCTAAG GTTGTTGCCT TGGTGGCATT ACCAAGCCTG
151  TTAATGAGCT TGTTGGTTCT ATGCAGCAAT AACAAAAAGG GTTTTTGGCA
201  AGAGATTGTT TATTATTTAA AAACCTATAA ATTGCTTGCT ATCGGCAGCG
251  TCGTTGGCAG CATTTTGGGG GTGAAGTTGC TTTTGATACT TCCAGTGTCT
301  TGGCTGCTTT TACTGATGGC AATCATTACA TTGTATTATT CTGTCAATGG
351  TATTTTAAAT GTATGTGCAA AAGCAAAAAA TATTCAAGTA GTTGCCAATA
401  ATAAGAATAT GGTTCTTTTT GGGTTTTTGG CAGGCATCAT CGGCGGTTCA
451  ACCAATGCCA TGTCTCCCAT ATTGTTAATA TTTTTGCTTA GCGAAACAGA
501  GAATAAAAAT CGTATCGCAA AATCAAGCAA TCTATGCTAT CTTTTGGCAA
551  AAATTGTTCA AATATATATG CTAAGAGACC AGTATTGGTT ATTAAATAAG
601  AGTGAATACG GTTTAATATT TTTACTGTCC GTATTGTCTG TTATTGGATT
651  GTATGTTGGA ATTCGGTTAA GGACTAAGAT TAGCCCAAAT TTTTTTAAAA
701  TGTTAATTTT TATTGTTTTA TTGGTATTGG CTCTGAAAAT CGGGTATTCA
751  GGTTTAATCA AACTTTAA
它编码的蛋白质具有氨基酸序列<SEQ ID 78>:
1    MQEIMQSIVF VAAAILHGIT GMGFPMLGTT ALAFIMPLSK V VALVALPSL
51   LMSLLVLCSN NKKGFWQEIV YYLKTYKLLA IGSVVGSILG VK LLLILPVS
101  WLLLLMAIIT LYYSVNGILN VCAKAKNIQV VANNKNMVLF GFLAG IIGGS
151  TNAMSPILLI FLLSETENKN RIAKSSNLCY LLAKIVQIYM LRDQYWLLNK
201  SEYG LIFLLS VLSVIGLYVG IRLRTKISPN  FFKMLIFIVL LVLALKIGYS
251  GLIKL*
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
实施例18
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 79>
1   ATGAGACATA TGAAAATACA AAATTATTTA CTAGTATTTA TAGTTTTACA
51  TATAGCCTTG ATAGTAATTA ATATAGTGTT TGGTTATTTT GTTTTTCTAT
101 TTGATTTTTT TGCGTTTTTG TTTTTTGCAA AGGTCTTTCT TGCTGTAAAT
151 TTATTATTTT TAGAAAAAAA CATAAAAAAC AAATTATTGT TTTTATTGCC
201 GATTTCTATT ATTATATGGA TGGTAATTCA TATTAGTATG ATAAATATAA
251 AATTTTATAA ATTTGAGCAT CAAATAAAGG AACAAAATAT ATCCTCGATT
301 ACTGGGGTGA TAAAACCACA TGATAGTTAT AATTATGTTT ATGACTCAAA
351 TGGATATGCT AAATTAAAAG ATAATCATAG ATATGGTAGG GTAATTAGAG
401 AAACACCTTA TATTGATGTA GTTGCATCTG ATGTTAAAAA TAAATCCATA
451 AGATTAAGCT TGGTTTGTGG TATTCATTCA TATGCTCCAT GTGCCAATTT
501 TATAAAATTT GTCAGG..
它对应于氨基酸序列<SEQ ID 80;ORF82>:
1   MRHMKIQNYL LVFIVLHIAL IVINIVFGYF VFLFDFFAFL FFANVFLAVN
51  LLFLEKNIKN KLLFLLPISI IIWMVIHISM INIKFYKFEH QIKEQNISSI
101 TGVIKPHDSY NYVYDSNGYA KLKDNHRYGR VIRETPYIDV VASDVKNKSI
151 RLSLVCGIHS YAPCANFIKF VR..
进一步的工作揭示了完整的核苷酸序列<SEQ ID 81>:
1    ATGAGACATA TGAAAAATAA AAATTATTTA CTAGTATTTA TAGTTTTACA
51   TATAGCCTTG ATAGTAATTA ATATAGTGTT TGGTTATTTT GTTTTTCTAT
101  TTGATTTTTT TGCGTTTTTG TTTTTTGCAA ACGTCTTTCT TGCTGTAAAT
151  TTATTATTTT TAGAAAAAAA CATAAAAAAC AAATTATTGT TTTTATTGCC
201  GATTTCTATT ATTATATGGA TGGTAATTCA TATTAGTATG ATAAATATAA
251  AATTTTATAA ATTTGAGCAT CAAATAAAGG AACAAAATAT ATCCTCGATT
301  ACTGGGGTGA TAAAACCACA TGATAGTTAT AATTATGTTT ATGACTCAAA
351  TGGATATGCT AAATTAAAAG ATAATCATAG ATATGGTAGG GTAATTAGAG
401  AAACACCTTA TATTGATGTA GTTGCATCTG ATGTTAAAAA TAAATCCATA
451  AGATTAAGCT TGGTTTGTGG TATTCATTCA TATGCTCCAT GTGCCAATTT
501  TATAAAATTT GCAAAAAAAC CTGTTAAAAT TTATTTTTAT AATCAACCTC
551  AAGGAGATTT TATAGATAAT GTAATATTTG AAATTAATGA TGGAAACAAA
601  AGTTTGTACT TGTTAGATAA GTATAAAACA TTTTTTCTTA TTGAAAACAG
651  TGTTTGTATC GTATTAATTA TTTTATATTT AAAATTTAAT TTGCTTTTAT
701  ATAGGACTTA CTTCAATGAG TTGGAATAG
它对应于氨基酸序列<SEQ ID 82;ORF82-1>:
1    MRHMKNKNYL LVFIVLHIAL IVINIVFGYF VFLFDFFAFL FFANVFLAVN
51   LLFLEKNIKN K LLFLLPISI IIWMVIHISM INIKFYKFEH QIKEQNISSI
101  TGVIKPHDSY NYVYDSNGYA KLKDNHRYGR VIRETPYIDV VASDVKNKSI
151  RLSLVCGIHS YAPCANFIKF AKKPVKIYFY NQPQGDFIDN VIFEINDGNK
201  SLYLLDKYKT  FFLIENSVCI VLIILYLKFN LLLYRTYFNE LE*
该氨基酸序列的计算机分析揭示了一个预计的前导肽。
还鉴定了一个脑膜炎奈瑟氏球菌菌株A的一个相应的ORE:
与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性
ORF82显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF82a)重叠的172个氨基酸内有97.1%的相同性:
                   10        20        30        40        50        60
orf82.pep  MRHMKIQNYLLVFIVLHIALIVINIVFGYFVFLFDFFAFLFFANVFLAVNLLFLEKNIKN
           ||||| :|||||||||||:||||||||||||||||||||||||||||| ||||||||||||
orf82a     MRHMKNKNYLLVFIVLHITLIVINIVFGYFVFLFDFFAFLFFANVFLAVNLLFLEKNIKN
                   10        20        30        40        50        60
                   70        80        90       100       110       120
orf82.pep  K LLFLLPISIIIWMVIHISMINIKFYKFEHQIKEQNISSITGVIKPHDSYNYVYDSNGYA
           | ||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||
orf82a     K LLFLLPISIIIWMVIHISMINIKFYKFEHQIKEQNISSITGVIKPHDSYNYVYDSNGYA
                   70        80        90       100       110       120
                  130       140       150       160       170
orf82.pep  KLKDNHRYGRVIRETPYIDVVASDVKNKSIRLSLVCGIHSYAPCANFIKFVR
           ||||||||||||||||||||||||||||||||||||||||||||||||||::
orf82a     KLKDNHRYGRVIRETPYIDVVASDVKNKSIRLSLVCGIHSYAPCANFIKFAKKPVKIYFY
                  130       140       150       160       170       180
ORF82a和ORF82-1显示在242个重叠的氨基酸内有99.2%的相同性:
orf82a.pep  MRHMKNKNYLLVFIVLHITLIVINIVFGYFVFLFDFFAFLFFANVFLAVNLLFLEKNIKN
            ||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||
orf82-1     MRHMKNKNYLLVFIVLHIALIVINIVFGYFVFLFDFFAFLFFANVFLAVNLLFLEKNIKN
orf82a.pep  KLLFLLPISIIIWMVIHISMINIKFYKFEHQIKEQNISSITGVIKPHDSYNYVYDSNGYA
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf82-1     KLLFLLPISIIIWMVIHISMINIKFYKFEHQIKEQNISSITGVIKPHDSYNYVYDSNGYA
orf82a.pep  KLKDNHRYGRVIRETPYIDVVASDVKNKSIRLSLVCGIHSYAPCANFIKFAKKPVKIYFY
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
orf82-1    KLKDNHRYGRVIRETPYIDVVASDVKNKSIRLSLVCGIHSYAPCANFIKFAKKPVKIYFY
orf82a.pep NQPQGDFIDNVIFEINDGKKSLYLLDKYKTFFLIENSVCIVLIILYLKFNLLLYRTYFNE
           ||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||
orf82-1    NQPQGDFIDNVIFEINDGNKSLYLLDKYKTFFLIENSVCIVLIILYLKFNLLLYRTYFNE
orf82a.pep LEX
           |||
orf82-1    LEX
全长ORF82a的核苷酸序列是<SEQ ID 83>:
1   ATGAGACATA TGAAAAATAA AAATTATTTA CTAGTATTTA TAGTTTTACA
51  TATAACCTTG ATAGTAATTA ATATAGTGTT TGGTTATTTT GTTTTTCTAT
101 TTGATTTTTT TGCGTTTTTG TTTTTTGCAA ACGTCTTTCT TGCTGTAAAT
151 TTATTATTTT TAGAAAAAAA CATAAAAAAC AAATTATTGT TTTTATTGCC
201 GATTTCTATT ATTATATGGA TGGTAATTCA TATTAGTATG ATAAATATAA
251 AATTTTATAA ATTTGAGCAT CAAATAAAGG AACAAAATAT ATCCTCGATT
301 ACTGGGGTGA TAAAACCACA TGATAGTTAT AATTATGTTT ATGACTCAAA
351 TGGATATGCT AAATTAAAAG ATAATCATAG ATATGGTAGG GTAATTAGAG
401 AAACACCTTA TATTGATGTA GTTGCATCTG ATGTTAAAAA TAAATCCATA
451 AGATTAAGCT TGGTTTGTGG TATTCATTCA TATGCTCCAT GTGCCAATTT
501 TATAAAATTT GCAAAAAAAC CTGTTAAAAT TTATTTTTAT AATCAACCTC
551 AAGGAGATTT TATAGATAAT GTAATATTTG AAATTAATGA TGGAAAAAAA
601 AGTTTGTACT TGTTAGATAA GTATAAAACA TTTTTTCTTA TTGAAAACAG
651 TGTTTGTATC GTATTAATTA TTTTATATTT AAAATTTAAT TTGCTTTTAT
701 ATAGGACTTA CTTCAATGAG TTGGAATAG
它编码的蛋白质具有氨基酸序列<SEQ ID 84>:
1   MRHMKNKNYL LVFIVLHITL IVINIVFGYF VFLFDFFAFL FFANVFLAVN
51  LLFLEKNIKN K LLFLLPISI IIWMVIHISM INIKFYKFEH QIKEQNISSI
101 TGVIKPHDSY NYVYDSNGYA KLKDNHRYGR VIRETPYIDV VASDVKNKSI
151 RLSLVCGIHS YAPCANFIKF AKKPVKIYFY NQPQGDFIDN VIFEINDGKK
201 SLYLLDKYKT  FFLIENSVCI VLIILYLKFN LLLYRTYFNE LE*
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
实施例19
在脑膜炎奈瑟氏球菌中鉴定出下列部分DNA序列<SEQ ID 85>
1    ..ACCCCCAACA GCGTGACCGT CTTGCCGTCT TTCGGCGGAT TCGGGCGTAC
51     CGGCGCGACC ATCAATGCAG CAGGCGGGGT CGGCATGACT GCCTTTTCGA
101    CAACCTTAAT TTCCGTAGCC GAGGGCGCGG TTGTAGAGCT GCAGGCCGTG
151    AGAGCCAAAG CCGTCAATGC AACCGCCGCT TGCATTTTTA CGGTCTTGAG
201    TAAGGACATT TTCGATTTCC TTTTTATTTT CCGTTTTCAG ACGGCTGACT
251    TCCGCCTGTA TTTTCGCCAA AGCCATGCCG ACAGCGTGCG CCTTGACTTC
301    ATATTTAAAA GCTTCCGCGC GTGCCAGTTC CAGTTCGCGC GCATAGTTTT
351    GAGCCGACAA CAGCAGGGCT TGCGCCTTGT CGCGCTCCAT CTTGTCGATG
401    ACCGCCTGCA GCTTCGCAAA TGCCGACTTG TAGCCTTGAT GGTGCGACAC
451    AGCCAAGCCC GTGCCGACAA GCGCGATAAT GGCAATCGGT TGCCAGTAAT
501    TCGCCAGCAG TTTCACGAGA TTCATTCTCG ACCTCCTGAC GCTTCACGCT
551    GA
它对应于氨基酸序列<SEQ ID 86;ORF 124>:
1    ..TPNSVTVLPS FGGFGRTGAT INAAGGVGMT AFSTTLISVA EGAVVELQAV
51     RAKAVNATAA  CIFTVLSKDI FDFLFIFRFQ TADFRLYFRQ SHADSVRLDF
101    IFKSFRACQF QFARIVLSRQ QQGLRLVALH LVDDRLQLRK CRLVALMVRH
151    SQARADKRDN GNRLPVIRQQ FHEIHSRPPD ASR*
该氨基酸序列的计算机分析预计了一个跨膜结构域。
进一步的工作揭示了完整的核苷酸序列<SEQ ID 87>:
1   ATGACTGCCT TTTCGACAAC CTTAATTTCC GTAGCCGAGG GCGCGGTTGT
51  AGAGCTGCAG GCCGTGAGAG CCAAAGCCGT CAATGCAACC GCCGCTTGCA
101 TTTTTACGGT CTTGAGTAAG GACATTTTCG ATTTCCTTTT TATTTTCCGT
151 TTTCAGACGG CTGACTTCCG CCTGTTTTTT CGCCAAAGCC ATGCCGACAG
201 CGTGCGCCTT GACTTCATAT TTTTTAGCTT CCGCGCGTGC CAGTTCCAGT
251 TCGCGCGCAT AGTTTTGAGC CGACAACAGC AGGGCTTGCG CCTTGTCGCG
301 CTCCATCTTG TCGATGACCG CCTGCTGCTT CGCAAATGCC GACTTGTAGC
351 CTTGATGGTG CGACACAGCC AAGCCCGTGC CGACAAGCGC GATAATGGCA
401 ATCGGTTGCC AGTTATTCGC CAGCAGTTTC ACGAGATTCA TTCTCGACCT
451 CCTGACGCTT CACGCTGA
它对应于氨基酸序列<SEQ ID 88;ORF124-1>:
1   MTAFSTTLIS VAEGAVVELQ AVRAKAVNAT AA CIFTVLSK DIFDFLFIFR
51  FQTADFRLFF RQSHADSVRL DFIFFSFRAC QFQFARIVLS RQQQGLRLVA
101 LHLVDDRLLL RKCRLVALMV RHSQARADKR DNGNRLPVIR QQFHEIHSRP
151 PDASR*
还鉴定了脑膜炎奈瑟氏球菌菌株A的一个相应的ORF:
与脑膜炎奈瑟氏球菌(菌株A)的预计ORF的同源性
ORF124显示在与脑膜炎奈瑟氏球菌菌株A的ORF(ORF124a)重叠的152个氨基酸内有87.5%的相同性:
                   10        20        30        40        50        60
orf124.pep TPNSVTVLPSFGGFGRTGATINAAGGVGMTAFSTTLISVAEGAVVELQAVRAKAVNATAA
                                       |||||||||||||||:|||||| |||||:|||
orf124a                                MTAFSTTLISVAEGALVELQAVMAKAVNTTAA
                                               10        20        30
                    70       80        90       100       110       120
orf124.pep CIFTVLSKDIFDFLFIFRFQTADFRLYFRQSHADSVRLDFIFKSFRACQFQFARIVLSRQ
           ||||||||||||||||||||||||||:|||||||:||||||| |||:  |||| :|||||
orf124a    CIFTVLSKDIFDFLFIFRFQTADFRLFFRQSHADGVRLDFIFFSFRTRLFQFAGVVLSRQ
                 40        50        60        70        80        90
                  130       140       150       160       170       180
orf124.pep QQGLRLVALHLVDDRLQLRKCRLVALMVRHSQARADKRDNGNRLPVIRQQFHEIHSRPPD
           ||||||||||:::||| ||| ||||||||| |:||||||:||||||||||||||||||||
orf124a    QQGLRLVALHFLNDRLLLRKSRLVALMVRHRQTRADKRDDGNRLPVIRQQFHEIHSRPPD
                100       110       120       130       140       150
orf124.pep ASRX
           :
orf124a    VX
ORF124a和ORF124-1显示在152个重叠的氨基酸内有89.5%的相同性:
orf124-1.pep  MTAFSTTLISVAEGAVVELQAVRAKAVNATAACIFTVLSKDIFDFLFIFRFQTADFRLFF
              |||||||||||||||:|||||| |||||:|||||||||||||||||||||||||||||||
orf124a       MTAFSTTLISVAEGALVELQAVMAKAVNTTAACIFTVLSKDIFDFLFIFRFQTADFRLFF
orf124-1.pep  RQSHADSVRLDFIFFSFRACQFQFARIVLSRQQQGLRLVALHLVDDRLLLRKCRLVALMV
              ||||||:|||||||||||:  |||| :|||||||||||||||:::||||||| |||||||
orf124a       RQSHADGVRLDFIFFSFRTRLFQFAGVVLSRQQQGLRLVALHFLNDRLLLRKSRLVALMV
orf124-1.pep  RHSQARADKRDNGNRLPVIRQQFHEIHSRPPDASRX
              || |:||||||:||||||||||||||||||||:
orf124a    RHRQTRADKRDDGNRLPVIRQQFHEIHSRPPDVX
全长ORF124a的核苷酸序列是<SEQ ID 89>:
1    ATGACCGCCT TTTCGACAAC CTTAATTTCC GTAGCCGAGG GCGCGCTTGT
51   AGAGCTGCAA GCCGTGATGG CCAAAGCCGT CAATACAACC GCCGCCTGCA
101  TTTTTACGGT CTTGAGTAAG GACATTTTCG ATTTCCTTTT TATTTTCCGT
151  TTTCAGACGG CTGACTTCCG CCTGTTTTTT CGCCAAAGCC ATGCCGACGG
201  CGTGCGCCTT GACTTCATAT TTTTTAGCTT CCGCACGCGC CTGTTCCAGT
251  TCGCGGGCGT AGTTTTGAGC CGACAACAGC AGGGCTTGCG CCTTGTCGCG
301  CTTCATTTTC TCAATGACCG CCTGCTGCTT CGCAAAAGCC GACTTGTAGC
351  CTTGATGGTG CGACACCGCC AAACCCGTGC CGACAAGCGC GATGATGGCA
401  ATCGGTTGCC AGTTATTCGC CAGCAGTTTC ACGAGATTCA TTCTCGACCT
451  CCTGACGTTT GA
它编码的蛋白质具有氨基酸序列<SEQ ID 90>:
1    MTAFSTTLIS VAEGALVELQ AVMAKAVNTT AA CIFTVLSK DIFDFLFIFR
51   FQTADFRLFF RQSHADGVRL DFIFFSFRTR LFQFAGVVLS RQQQGLRLVA
101  LHFLNDRLLL RKSRLVALMV RHRQTRADKR DDGNRLPVIR QQFHEIHSRP
151  PDV*
如上所述扩增ORF124-1。图7显示了ORF124-1的亲水性曲线、抗原性指数和AMPHI区域。
根据该分析,预计脑膜炎奈瑟氏球菌的此蛋白及其表位可用作疫苗或诊断用的抗原。
应理解本发明只是通过实施例作了描述,而在本发明的精神和范围内还可作改动。
表I-PCR引物
  ORF   引物  序列  限制性位点
ORF38ORF40ORF41ORF44ORF51ORF52ORF56ORF69ORF82ORF114ORF124 正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向  CG CGGATCCCATATG-TCGCCGCAAAATTCCGACCCG CTCGAG-TTTTGCCGCGTTAAAAGCCG CGGATCCCATATG-ACCGTGAAGACCGCCCCCG CTCGAG-CCACTGATAACCGACAGACG CGGATCCCATATG-TATTTGAAACAGCTCCAAGCCCG CTCGAG-TTCTGGGTGAATGTTAG CGGATCCCATATG-GGCACGGACAACCCCCCCG CTCGAG-ACGTGGGGAACAGTCTG CGGATCCCATATG-AAAAATATTCAAGTAGTTGCCCCG CTCGAG-AAGTTTGATTAAACCCGCG CGGATCCCATATG-TGCCAACCGCAATCCGCCCG CTCGAG-TTTTTCCAGCTCCGGCAGC GGATCCCATATG-GTTATCGGAATATTACTCGCCCG CTCGAG-GGCTGCAGAAGCTGGCG CGGATCCCATATG-CGGACGTGGTTGGTTTTCCCG CTCGAG-ATATCTTCCGTTTTTTTCACCG CGGATCCGCTAGC-GTAAATTTATTATTTTTAGAACCCG CTCGAG-TTCCAACTCATTGAAGTACG CGGATCCCATATG-AATAAAGGTTTACATCGCATCCCG CTCGAG-AATCGCTGCACCGGCTCG CGGATCCCATATG-ACTGCCTTTTCGACACCCG CTCGAG-GCGTGAAGCGTCAGGA BamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NheIXhoIBamHI-NheIXhoIBamHI-NheIXhoI
表II-克隆、表达和纯化
  ORF   PCR/克隆   His-融合物表达   GST-融合物表达     纯化
  orf38   +   +   +     His-融合物
  orf40   +   +   +     His-融合物
  orf41   +   未测定   未测定
  orf44   +   +   +     His-融合物
  orf51   +   未测定   未测定
  orf52   +   未测定   +     GST-融合物
  orf56   +   未测定   未测定
  orf69   +   未测定   未测定
  orf82   +   未测定   未测定
  orf114   +   未测定   +     GST-融合物
  orf124   +   未测定   未测定

Claims (14)

1.一种蛋白质,它包含选自SEQ ID 8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88和90的氨基酸序列。
2.一种蛋白质,它与权利要求1所述的蛋白质有50%或更高的序列相同性。
3.一种蛋白质,它包含选自SEQ ID 8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88和90的氨基酸序列的片段。
4.一种抗体,它与权利要求1至3任一项所述的蛋白质结合。
5.一种核酸分子,它编码权利要求1至3任一项所述的蛋白质。
6.根据权利要求5所述的核酸分子,它包含选自SEQ ID 7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87和89的核苷酸序列。
7.一种核酸分子,它包含选自SEQ ID 7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87和89的核苷酸序列的片段。
8.一种核酸分子,它包含与权利要求5至7任一项所述的核酸分子互补的核苷酸序列。
9.一种核酸分子,它包含的核苷酸序列与权利要求5至8任一项所述的核酸分子有50%或更高的序列相同性。
10.一种核酸分子,它在高度严谨条件下能与权利要求5至9任一项所述的核酸分子杂交。
11.一种组合物,它包含权利要求1至10任一项所述的蛋白质、核酸分子或抗体。
12.根据权利要求11所述的组合物,它是疫苗组合物或诊断组合物。
13.根据权利要求11或12所述的组合物,它用作药物。
14.权利要求11所述的组合物在生产用来治疗或预防由奈瑟氏球菌、尤其是脑膜炎奈瑟氏球菌引起的感染的药剂中的应用。
CNA2003101220871A 1998-01-14 1999-01-14 脑膜炎奈瑟氏球菌抗原 Pending CN1597694A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
GBGB9800760.2A GB9800760D0 (en) 1998-01-14 1998-01-14 Antigens
GB9800760.2 1998-01-14
GBGB9819015.0A GB9819015D0 (en) 1998-09-01 1998-09-01 Antigens
GB9819015.0 1998-09-01
GB9822143.5 1998-10-09
GBGB9822143.5A GB9822143D0 (en) 1998-10-09 1998-10-09 Antigens

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB998038733A Division CN1224708C (zh) 1998-01-14 1999-01-14 脑膜炎奈瑟氏球菌抗原

Publications (1)

Publication Number Publication Date
CN1597694A true CN1597694A (zh) 2005-03-23

Family

ID=27269171

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB998038733A Expired - Fee Related CN1224708C (zh) 1998-01-14 1999-01-14 脑膜炎奈瑟氏球菌抗原
CNA2003101220871A Pending CN1597694A (zh) 1998-01-14 1999-01-14 脑膜炎奈瑟氏球菌抗原

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB998038733A Expired - Fee Related CN1224708C (zh) 1998-01-14 1999-01-14 脑膜炎奈瑟氏球菌抗原

Country Status (16)

Country Link
US (3) US6709660B1 (zh)
EP (3) EP2210945B1 (zh)
JP (2) JP4399112B2 (zh)
CN (2) CN1224708C (zh)
AT (1) ATE446368T1 (zh)
AU (1) AU1979599A (zh)
BR (1) BR9906927A (zh)
CA (1) CA2317815A1 (zh)
CY (2) CY1109708T1 (zh)
DE (1) DE69941567D1 (zh)
DK (1) DK1047784T4 (zh)
ES (1) ES2333071T5 (zh)
HK (1) HK1030435A1 (zh)
PT (1) PT1047784E (zh)
SG (2) SG152917A1 (zh)
WO (1) WO1999036544A2 (zh)

Families Citing this family (139)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0909323B1 (en) 1996-01-04 2007-02-28 Novartis Vaccines and Diagnostics, Inc. Helicobacter pylori bacterioferritin
FR2751000B1 (fr) * 1996-07-12 1998-10-30 Inst Nat Sante Rech Med Adn specifiques des bacteries de l'espece neisseria meningitidis, leurs procedes d'obtention et leurs applications biologiques
JP2001500738A (ja) 1996-09-17 2001-01-23 カイロン コーポレイション 細胞内疾患を処置するための組成物および方法
GB9726398D0 (en) * 1997-12-12 1998-02-11 Isis Innovation Polypeptide and coding sequences
WO1999036544A2 (en) 1998-01-14 1999-07-22 Chiron S.P.A. Neisseria meningitidis antigens
EP2261349A3 (en) 1998-05-01 2012-01-11 Novartis Vaccines and Diagnostics, Inc. Neisseria meningitidis antigens and compositions
GB9810276D0 (en) * 1998-05-13 1998-07-15 Smithkline Beecham Biolog Novel compounds
US6610306B2 (en) 1998-10-22 2003-08-26 The University Of Montana OMP85 protein of neisseria meningitidis, compositions containing the same and methods of use thereof
US10967045B2 (en) 1998-11-02 2021-04-06 Secretary of State for Health and Social Care Multicomponent meningococcal vaccine
PT1154790E (pt) * 1999-02-26 2005-03-31 Chiron Srl Reforco da actividade bactericida de antigenios contra a neisseria com oligonucleotidos contendo motivos cg
AU2004240199B2 (en) * 1999-04-30 2007-05-17 Novartis Vaccines And Diagnostics S.R.L. Conserved Neisserial antigens
WO2000066741A2 (en) 1999-04-30 2000-11-09 Chiron S.P.A. Conserved neisserial antigens
EP1860191A3 (en) * 1999-05-19 2008-02-13 Novartis Vaccines and Diagnostics S.r.l. Combination neisserial compositions
GB9916529D0 (en) * 1999-07-14 1999-09-15 Chiron Spa Antigenic peptides
CN1433471A (zh) 1999-11-29 2003-07-30 启龙股份公司 85kgDa奈瑟球菌的抗原
GB9928196D0 (en) * 1999-11-29 2000-01-26 Chiron Spa Combinations of B, C and other antigens
AU2006202664B2 (en) * 1999-11-29 2010-02-25 Glaxosmithkline Biologicals S.A. Compositions comprising Neisseria meningitidis antigens from serogroups B and C as well as a further antigen
EP2275129A3 (en) 2000-01-17 2013-11-06 Novartis Vaccines and Diagnostics S.r.l. Outer membrane vesicle (OMV) vaccine comprising N. meningitidis serogroup B outer membrane proteins
WO2001055182A1 (en) * 2000-01-25 2001-08-02 The University Of Queensland PROTEINS COMPRISING CONSERVED REGIONS OF NEISSERIA MENINGITIDIS SURFACE ANTIGEN NhhA
ES2281409T3 (es) 2000-02-28 2007-10-01 Novartis Vaccines And Diagnostics S.R.L. Expresion heterologa de proteinas de neisseria.
NO20002828D0 (no) * 2000-06-02 2000-06-02 Statens Inst For Folkehelse Proteinholdig vaksine mot Neisseria meningtidis serogruppe samt fremgangsmÕte ved fremstilling derav
BRPI0112928B1 (pt) 2000-07-27 2017-08-29 Children's Hospital & Research Center At Oakland A composition comprising preparations comprising outer membrane vesicles (OMV), microvesicles (MV) or both MVO and MV
CA2425303A1 (en) 2000-10-27 2002-05-02 John Telford Nucleic acids and proteins from streptococcus groups a & b
GB0107661D0 (en) 2001-03-27 2001-05-16 Chiron Spa Staphylococcus aureus
GB0107658D0 (en) 2001-03-27 2001-05-16 Chiron Spa Streptococcus pneumoniae
WO2002099035A2 (en) 2001-05-31 2002-12-12 Chiron Corporation Chimeric alphavirus replicon particles
GB0115176D0 (en) 2001-06-20 2001-08-15 Chiron Spa Capular polysaccharide solubilisation and combination vaccines
GB0118249D0 (en) 2001-07-26 2001-09-19 Chiron Spa Histidine vaccines
JP4592284B2 (ja) 2001-07-27 2010-12-01 カイロン ソチエタ ア レスポンサビリタ リミタータ 髄膜炎菌付着因子
GB0121591D0 (en) 2001-09-06 2001-10-24 Chiron Spa Hybrid and tandem expression of neisserial proteins
US7838015B2 (en) * 2001-10-03 2010-11-23 Novartis Vaccines And Diagnostics, Inc. Adjuvanted meningococcus compositions
AU2002334844B2 (en) * 2001-10-03 2007-08-02 Novartis Vaccines And Diagnostics, Inc. Adjuvanted meningococcus compositions
AR045702A1 (es) 2001-10-03 2005-11-09 Chiron Corp Composiciones de adyuvantes.
MX339524B (es) 2001-10-11 2016-05-30 Wyeth Corp Composiciones inmunogenicas novedosas para la prevencion y tratamiento de enfermedad meningococica.
GB0129007D0 (en) * 2001-12-04 2002-01-23 Chiron Spa Adjuvanted antigenic meningococcal compositions
NZ546711A (en) 2001-12-12 2008-06-30 Chiron Srl Immunisation against chlamydia trachomatis
EP2572707A3 (en) 2002-02-20 2013-11-06 Novartis Vaccines and Diagnostics, Inc. Microparticles with adsorbed polypeptide-containing molecules
WO2004014419A1 (en) * 2002-08-02 2004-02-19 Glaxosmithkline Biologicals S.A. Vaccine composition comprising transferrin binding protein and hsf from gram negative bacteria
GB0220194D0 (en) 2002-08-30 2002-10-09 Chiron Spa Improved vesicles
DK2351579T3 (en) 2002-10-11 2017-01-09 Novartis Vaccines And Diagnostics S R L Polypeptide vaccines for broad protection against hypervirulent meningococcal lineages.
PT1556477T (pt) 2002-11-01 2017-11-14 Glaxosmithkline Biologicals Sa Processo de secagem
EP2279746B1 (en) 2002-11-15 2013-10-02 Novartis Vaccines and Diagnostics S.r.l. Surface proteins in neisseria meningitidis
GB0227346D0 (en) 2002-11-22 2002-12-31 Chiron Spa 741
US20060223756A1 (en) * 2002-12-18 2006-10-05 Gene Liau Endothelial cell specifically binding peptides
WO2004060396A2 (en) 2002-12-27 2004-07-22 Chiron Corporation Immunogenic compositions containing phospholpid
EP2289546A3 (en) 2003-01-30 2011-03-30 Novartis Vaccines and Diagnostics S.r.l. Injectable vaccines against multiple meningococcal serogroups
ES2423800T3 (es) 2003-03-28 2013-09-24 Novartis Vaccines And Diagnostics, Inc. Uso de compuestos orgánicos para la inmunopotenciación
GB0308198D0 (en) 2003-04-09 2003-05-14 Chiron Srl ADP-ribosylating bacterial toxin
US7731967B2 (en) 2003-04-30 2010-06-08 Novartis Vaccines And Diagnostics, Inc. Compositions for inducing immune responses
WO2005020964A1 (en) 2003-06-02 2005-03-10 Chiron Corporation Immunogenic compositions based on microparticles comprising adsorbed toxoid and a polysaccharide-containing antigen
EP1670506B1 (en) 2003-10-02 2012-11-21 Novartis AG Liquid vaccines for multiple meningococcal serogroups
GB0323103D0 (en) 2003-10-02 2003-11-05 Chiron Srl De-acetylated saccharides
GB0408977D0 (en) 2004-04-22 2004-05-26 Chiron Srl Immunising against meningococcal serogroup Y using proteins
CA2571710A1 (en) 2004-06-24 2006-11-02 Nicholas Valiante Small molecule immunopotentiators and assays for their detection
US20060165716A1 (en) 2004-07-29 2006-07-27 Telford John L Immunogenic compositions for gram positive bacteria such as streptococcus agalactiae
US20090070895A1 (en) * 2004-12-24 2009-03-12 Anne Rae Vacuole targeting peptide and nucleic acid
EP2433647A3 (en) 2005-01-27 2012-06-06 Children's Hospital & Research Center at Oakland GNA1870-based vesicle vaccines for broad spectrum protection against diseases caused by Neisseria meningitidis
GB0502095D0 (en) 2005-02-01 2005-03-09 Chiron Srl Conjugation of streptococcal capsular saccharides
GB0502096D0 (en) 2005-02-01 2005-03-09 Chiron Srl Purification of streptococcal capsular polysaccharide
JP2008530245A (ja) 2005-02-18 2008-08-07 ノバルティス ヴァクシンズ アンド ダイアグノスティクス, インコーポレイテッド 尿路病原性菌株由来の抗原
WO2006089264A2 (en) 2005-02-18 2006-08-24 Novartis Vaccines And Diagnostics Inc. Proteins and nucleic acids from meningitis/sepsis-associated escherichia coli
EP1945247A1 (en) 2005-10-18 2008-07-23 Novartis Vaccines and Diagnostics, Inc. Mucosal and systemic immunizations with alphavirus replicon particles
ES2514316T3 (es) 2005-11-22 2014-10-28 Novartis Vaccines And Diagnostics, Inc. Partículas similares a virus (VLPs) de Norovirus y Sapovirus
GB0524066D0 (en) 2005-11-25 2006-01-04 Chiron Srl 741 ii
EP1998800A2 (en) 2006-01-18 2008-12-10 University Of Chicago Compositions and methods related to staphylococcal bacterium proteins
WO2007109813A1 (en) 2006-03-23 2007-09-27 Novartis Ag Imidazoquinoxaline compounds as immunomodulators
CA2656474A1 (en) 2006-06-29 2008-01-03 Novartis Ag Polypeptides from neisseria meningitidis
US20100166788A1 (en) 2006-08-16 2010-07-01 Novartis Vaccines And Diagnostics Immunogens from uropathogenic escherichia coli
AR064642A1 (es) 2006-12-22 2009-04-15 Wyeth Corp Polinucleotido vector que lo comprende celula recombinante que comprende el vector polipeptido , anticuerpo , composicion que comprende el polinucleotido , vector , celula recombinante polipeptido o anticuerpo , uso de la composicion y metodo para preparar la composicion misma y preparar una composi
GB0700562D0 (en) 2007-01-11 2007-02-21 Novartis Vaccines & Diagnostic Modified Saccharides
US7906117B2 (en) 2007-05-21 2011-03-15 Alderbio Holdings Llc Antagonists of IL-6 to prevent or treat cachexia, weakness, fatigue, and/or fever
US9701747B2 (en) 2007-05-21 2017-07-11 Alderbio Holdings Llc Method of improving patient survivability and quality of life by anti-IL-6 antibody administration
US8178101B2 (en) 2007-05-21 2012-05-15 Alderbio Holdings Inc. Use of anti-IL-6 antibodies having specific binding properties to treat cachexia
WO2008144757A1 (en) * 2007-05-21 2008-11-27 Alder Biopharmaceuticals, Inc. Novel rabbit antibody humanization methods and humanized rabbit antibodies
US20090238825A1 (en) * 2007-05-21 2009-09-24 Kovacevich Brian R Novel rabbit antibody humanization methods and humanized rabbit antibodies
US8404235B2 (en) 2007-05-21 2013-03-26 Alderbio Holdings Llc Antagonists of IL-6 to raise albumin and/or lower CRP
US8252286B2 (en) 2007-05-21 2012-08-28 Alderbio Holdings Llc Antagonists of IL-6 to prevent or treat thrombosis
NZ581596A (en) 2007-05-21 2012-02-24 Alderbio Holdings Llc Antibodies to il-6 and use thereof
US8062864B2 (en) 2007-05-21 2011-11-22 Alderbio Holdings Llc Nucleic acids encoding antibodies to IL-6, and recombinant production of anti-IL-6 antibodies
GB0713880D0 (en) 2007-07-17 2007-08-29 Novartis Ag Conjugate purification
US8287885B2 (en) 2007-09-12 2012-10-16 Novartis Ag GAS57 mutant antigens and GAS57 antibodies
PT2200642E (pt) 2007-10-19 2012-05-30 Novartis Ag Formulações de vacinas meningocócicas
JP2011506334A (ja) 2007-12-07 2011-03-03 ノバルティス アーゲー 免疫応答を誘導するための組成物
NZ586430A (en) 2007-12-21 2012-09-28 Novartis Ag Mutant forms of streptolysin o (slo)
CA2716212A1 (en) 2008-02-21 2009-08-27 Novartis Ag Meningococcal fhbp polypeptides
WO2009111337A1 (en) 2008-03-03 2009-09-11 Irm Llc Compounds and compositions as tlr activity modulators
SI2349520T1 (sl) 2008-10-27 2016-08-31 Glaxosmithkline Biologicals S.A. Postopek čiščenja za ogljikohidrat iz Streptococcus skupine A
EP3338799B1 (en) * 2008-11-25 2021-04-07 Vitaeris Inc. Antibodies to il-6 and use thereof
US9212223B2 (en) 2008-11-25 2015-12-15 Alderbio Holdings Llc Antagonists of IL-6 to prevent or treat thrombosis
US9452227B2 (en) * 2008-11-25 2016-09-27 Alderbio Holdings Llc Methods of treating or diagnosing conditions associated with elevated IL-6 using anti-IL-6 antibodies or fragments
US8992920B2 (en) 2008-11-25 2015-03-31 Alderbio Holdings Llc Anti-IL-6 antibodies for the treatment of arthritis
US8323649B2 (en) 2008-11-25 2012-12-04 Alderbio Holdings Llc Antibodies to IL-6 and use thereof
US8337847B2 (en) 2008-11-25 2012-12-25 Alderbio Holdings Llc Methods of treating anemia using anti-IL-6 antibodies
US8420089B2 (en) 2008-11-25 2013-04-16 Alderbio Holdings Llc Antagonists of IL-6 to raise albumin and/or lower CRP
US8585505B2 (en) 2008-12-15 2013-11-19 Tetris Online, Inc. Inter-game interactive hybrid asynchronous computer game infrastructure
CN102307477B (zh) 2009-01-05 2015-07-29 埃皮托吉尼西斯股份有限公司 佐剂组合物及使用方法
MX2011007456A (es) 2009-01-12 2011-08-03 Novartis Ag Antigenos del dominio de proteina de superficie de union a colageno tipo b (can_b) en vacunas contra bacteria gram positiva.
ITMI20090946A1 (it) 2009-05-28 2010-11-29 Novartis Ag Espressione di proteine ricombinanti
JP5867952B2 (ja) 2009-06-10 2016-02-24 ノバルティス アーゲー ベンゾナフチリジン含有ワクチン
WO2011008400A2 (en) 2009-06-16 2011-01-20 Novartis Ag High-throughput complement-mediated antibody-dependent and opsonic bactericidal assays
NZ598458A (en) 2009-08-27 2014-03-28 Novartis Ag Hybrid polypeptides including meningococcal fhbp sequences
WO2011026111A1 (en) 2009-08-31 2011-03-03 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Oral delivery of a vaccine to the large intestine to induce mucosal immunity
TWI445708B (zh) 2009-09-02 2014-07-21 Irm Llc 作為tlr活性調節劑之化合物及組合物
CN102844047B (zh) 2009-09-02 2017-04-05 诺华股份有限公司 含tlr活性调节剂的免疫原性组合物
US8974799B2 (en) 2009-09-30 2015-03-10 Novartis Ag Conjugation of Staphylococcus aureus type 5 and type 8 capsular polysaccharides
JP5960055B2 (ja) 2009-10-27 2016-08-02 ノバルティス アーゲー 改変髄膜炎菌fHBPポリペプチド
BR122019005883A8 (pt) 2009-10-30 2022-10-04 Novartis Ag Método para liberação de polissacarídeo capsular, processo de purificação de sacarídeos capsulares tipo 5 e tipo 8 de staphylococcus aureus e composição
WO2011057148A1 (en) 2009-11-05 2011-05-12 Irm Llc Compounds and compositions as tlr-7 activity modulators
EP2504032A4 (en) 2009-11-24 2013-06-19 Alderbio Holdings Llc IL-6 ANTAGONISTS FOR PREVENTING OR TREATING THROMBOSIS
US9775921B2 (en) 2009-11-24 2017-10-03 Alderbio Holdings Llc Subcutaneously administrable composition containing anti-IL-6 antibody
BR112012014624A8 (pt) 2009-12-15 2017-12-26 Novartis Ag suspensão homogênea de compostos de imunopotenciação e usos dos destes
AU2011232421B2 (en) 2010-03-23 2015-08-13 Novartis Ag Compounds (cystein based lipopeptides) and compositions as TLR2 agonists used for treating infections, inflammations, respiratory diseases etc.
CA2795403C (en) 2010-04-08 2019-01-15 University Of Pittsburgh-Of The Commonwealth System Of Higher Education B-cell antigen presenting cell assay
ES2850973T3 (es) 2010-08-23 2021-09-01 Wyeth Llc Formulaciones estables de antígenos rLP2086 de Neisseria meningitidis
ES2585328T5 (es) 2010-09-10 2022-12-14 Wyeth Llc Variantes no lipidadas de antígenos ORF2086 de Neisseria meningitidis
CA2810971C (en) 2010-09-10 2020-11-03 Novartis Ag Developments in meningococcal outer membrane vesicles
GB201101665D0 (en) 2011-01-31 2011-03-16 Novartis Ag Immunogenic compositions
WO2012071554A2 (en) 2010-11-23 2012-05-31 Alder Biopharmaceuticals, Inc. Anti-il-6 antibodies for the treatment of oral mucositis
WO2012085668A2 (en) 2010-12-24 2012-06-28 Novartis Ag Compounds
WO2012178118A1 (en) 2011-06-24 2012-12-27 Epitogenesis Inc. Pharmaceutical compositions, comprising a combination of select carriers, vitamins, tannins and flavonoids as antigen-specific immuno-modulators
US9493517B2 (en) 2011-11-07 2016-11-15 Glaxosmithkline Biologicals Sa Conjugates comprising an antigen and a carrier molecule
MX2018011291A (es) 2012-03-09 2023-01-31 Pfizer Composiciones de neisseria meningitidis y metodos de las mismas.
SA115360586B1 (ar) 2012-03-09 2017-04-12 فايزر انك تركيبات لعلاج الالتهاب السحائي البكتيري وطرق لتحضيرها
ES2847923T3 (es) 2012-06-14 2021-08-04 Glaxosmithkline Biologicals Sa Vacunas contra el meningococo del serogrupo X
GB201211154D0 (en) * 2012-06-22 2012-08-08 Univ Southampton Composition
AU2013326503B2 (en) 2012-10-03 2018-04-19 Glaxosmithkline Biologicals Sa Immunogenic composition
CA2899787A1 (en) 2013-02-01 2014-08-07 Glaxosmithkline Biologicals Sa Intradermal delivery of immunological compositions comprising toll-like receptor agonists
EP2964665B1 (en) 2013-03-08 2018-08-01 Pfizer Inc Immunogenic fusion polypeptides
KR101905278B1 (ko) 2013-09-08 2018-10-08 화이자 인코포레이티드 나이세리아 메닌지티디스 조성물 및 그의 방법
AU2016221318B2 (en) 2015-02-19 2020-06-25 Pfizer Inc. Neisseria meningitidis compositions and methods thereof
CN106290849A (zh) * 2015-05-13 2017-01-04 上海凯创生物技术有限公司 一种脑膜炎菌胶体金检测试剂盒
WO2017144359A1 (en) 2016-02-22 2017-08-31 Boehringer Ingelheim Vetmedica Gmbh Method for the immobilization of biomolecules
BE1024634B1 (fr) 2016-04-05 2018-05-14 Gsk Vaccines S.R.L. Compositions immunogenes
KR102567845B1 (ko) 2017-01-31 2023-08-17 화이자 인코포레이티드 네이세리아 메닌기티디스 조성물 및 그의 방법
US11464845B2 (en) 2017-07-21 2022-10-11 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Neisseria meningitidis immunogenic compositions
CA3090271A1 (en) 2018-02-12 2019-08-15 Inimmune Corporation Toll-like receptor ligands
WO2020086408A1 (en) 2018-10-26 2020-04-30 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services A high-yield perfusion-based transient gene expression bioprocess
JP2023547676A (ja) 2020-11-04 2023-11-13 エリゴ・バイオサイエンス DNAペイロードをアクネ菌集団へとin situ送達するためのファージ由来粒子
CN114015805A (zh) * 2021-10-13 2022-02-08 四川农业大学 检测盖塔病毒的荧光rt-raa引物、试剂盒及其应用

Family Cites Families (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2386796A (en) 1942-08-05 1945-10-16 Bond Crown & Cork Co Extruding device
DE2855719A1 (de) 1978-12-22 1980-07-10 Siemens Ag Zahnaerztliche handstueckanordnung
US4336336A (en) 1979-01-12 1982-06-22 President And Fellows Of Harvard College Fused gene and method of making and using same
AU545912B2 (en) 1980-03-10 1985-08-08 Cetus Corporation Cloned heterologous jive products in bacillies
ZA811368B (en) 1980-03-24 1982-04-28 Genentech Inc Bacterial polypedtide expression employing tryptophan promoter-operator
NZ199722A (en) 1981-02-25 1985-12-13 Genentech Inc Dna transfer vector for expression of exogenous polypeptide in yeast;transformed yeast strain
JPS57181099A (en) 1981-04-29 1982-11-08 Biogen Nv Bacillus cloning vector, recombinant dna molecule, bacillus host transformed thereby and manufacture of polypeptide expressing dna order and being coded thereby
US4551433A (en) 1981-05-18 1985-11-05 Genentech, Inc. Microbial hybrid promoters
US4405712A (en) 1981-07-01 1983-09-20 The United States Of America As Represented By The Department Of Health And Human Services LTR-Vectors
US4769330A (en) 1981-12-24 1988-09-06 Health Research, Incorporated Modified vaccinia virus and methods for making and using the same
US4603112A (en) 1981-12-24 1986-07-29 Health Research, Incorporated Modified vaccinia virus
US4876197A (en) 1983-02-22 1989-10-24 Chiron Corporation Eukaryotic regulatable transcription
CA1341302C (en) 1983-02-22 2001-10-09 Rae Lyn Burke Yeast expression systems with vectors having gapdh or pyk promoters and synthesis of foreign protein
JPS59166086A (ja) 1983-03-09 1984-09-19 Teruhiko Beppu 新規な発現型プラスミドとそれらを用いて仔牛プロキモシン遺伝子を大腸菌内で発現させる方法
US4546083A (en) 1983-04-22 1985-10-08 Stolle Research & Development Corporation Method and device for cell culture growth
US4588684A (en) 1983-04-26 1986-05-13 Chiron Corporation a-Factor and its processing signals
JPS59205983A (ja) 1983-04-28 1984-11-21 ジエネツクス・コ−ポレイシヨン 異種遺伝子を原核微生物で発現させる方法
US4663280A (en) 1983-05-19 1987-05-05 Public Health Research Institute Of The City Of New York Expression and secretion vectors and method of constructing vectors
IE58011B1 (en) 1983-05-27 1993-06-16 Texas A & M Univ Sys Method for producing a recombinant baculovirus expression vector
US4689406A (en) 1983-08-10 1987-08-25 Amgen Enhancement of microbial expression of polypeptides
US4870008A (en) 1983-08-12 1989-09-26 Chiron Corporation Secretory expression in eukaryotes
JPS6054685A (ja) 1983-09-02 1985-03-29 Suntory Ltd 改良発現ベクタ−およびその利用
EP0136907A3 (en) 1983-10-03 1986-12-30 Genentech, Inc. A xenogeneic expression control system, a method of using it, expression vectors containing it, cells transformed thereby and heterologous proteins produced therefrom
DK518384A (da) 1984-01-31 1985-07-01 Idaho Res Found Vektor til fremstilling af et gen-produkt i insektceller, fremgangsmaade til dens fremstilling samt dens anvendelse
DK219084D0 (da) * 1984-05-02 1984-05-02 Frederik Carl Peter Lindberg Antigen
US4880734A (en) 1984-05-11 1989-11-14 Chiron Corporation Eukaryotic regulatable transcription
EP0164556B1 (en) 1984-05-11 1994-03-02 Chiron Corporation Enhanced yeast transcription employing hybrid promoter region constructs
US5288641A (en) 1984-06-04 1994-02-22 Arch Development Corporation Herpes Simplex virus as a vector
CA1282721C (en) 1984-06-04 1991-04-09 Bernard Roizman Herpes simplex virus as a vector
US4738921A (en) 1984-09-27 1988-04-19 Eli Lilly And Company Derivative of the tryptophan operon for expression of fused gene products
US4745056A (en) 1984-10-23 1988-05-17 Biotechnica International, Inc. Streptomyces secretion vector
US4837148A (en) 1984-10-30 1989-06-06 Phillips Petroleum Company Autonomous replication sequences for yeast strains of the genus pichia
US4762915A (en) 1985-01-18 1988-08-09 Liposome Technology, Inc. Protein-liposome conjugates
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
DE3679343D1 (de) 1985-03-28 1991-06-27 Chiron Corp Expression durch verwendung von fusionsgenen fuer proteinproduktion.
US4865974A (en) 1985-09-20 1989-09-12 Cetus Corporation Bacterial methionine N-terminal peptidase
US4777127A (en) 1985-09-30 1988-10-11 Labsystems Oy Human retrovirus-related products and methods of diagnosing and treating conditions associated with said retrovirus
JPS6296086A (ja) 1985-10-21 1987-05-02 Agency Of Ind Science & Technol 複合プラスミド
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
US5091309A (en) 1986-01-16 1992-02-25 Washington University Sindbis virus vectors
US4861719A (en) 1986-04-25 1989-08-29 Fred Hutchinson Cancer Research Center DNA constructs for retrovirus packaging cell lines
ATE110111T1 (de) 1986-05-02 1994-09-15 Gist Brocades Nv Sekretionssignal-selektionsvektoren für extrazelluläre proteinsynthese in bazillen.
EP0324789B1 (en) 1986-10-02 2003-08-20 Massachusetts Institute Of Technology Methods of regulating metabolic stability of proteins
JPS63123383A (ja) 1986-11-11 1988-05-27 Mitsubishi Kasei Corp ハイブリツドプロモ−タ−、発現調節dna配列および発現ベクタ−
GB8702816D0 (en) 1987-02-07 1987-03-11 Al Sumidaie A M K Obtaining retrovirus-containing fraction
US5219740A (en) 1987-02-13 1993-06-15 Fred Hutchinson Cancer Research Center Retroviral gene transfer into diploid fibroblasts for gene therapy
JP2795850B2 (ja) 1987-03-23 1998-09-10 ザイモジェネティクス,インコーポレイティド 酵母発現ベクター
US4980289A (en) 1987-04-27 1990-12-25 Wisconsin Alumni Research Foundation Promoter deficient retroviral vector
WO1989001973A2 (en) 1987-09-02 1989-03-09 Applied Biotechnology, Inc. Recombinant pox virus for immunization against tumor-associated antigens
DK463887D0 (da) 1987-09-07 1987-09-07 Novo Industri As Gaerleader
EP0378576B1 (en) 1987-09-11 1995-01-18 Whitehead Institute For Biomedical Research Transduced fibroblasts and uses therefor
US4929555A (en) 1987-10-19 1990-05-29 Phillips Petroleum Company Pichia transformation
ES2012739T5 (es) 1987-11-18 2001-12-01 Chiron Corp Diagnosticos para nanbv.
WO1989005349A1 (en) 1987-12-09 1989-06-15 The Australian National University Method of combating viral infections
CA1340772C (en) 1987-12-30 1999-09-28 Patricia Tekamp-Olson Expression and secretion of heterologous protiens in yeast employing truncated alpha-factor leader sequences
US4973551A (en) 1988-01-15 1990-11-27 Merck & Co., Inc. Vector for the expression of fusion proteins and protein immunogens
US5662896A (en) 1988-03-21 1997-09-02 Chiron Viagene, Inc. Compositions and methods for cancer immunotherapy
WO1989009271A1 (en) 1988-03-21 1989-10-05 Viagene, Inc. Recombinant retroviruses
US5591624A (en) 1988-03-21 1997-01-07 Chiron Viagene, Inc. Retroviral packaging cell lines
US5206152A (en) 1988-04-08 1993-04-27 Arch Development Corporation Cloning and expression of early growth regulatory protein genes
US5422120A (en) 1988-05-30 1995-06-06 Depotech Corporation Heterovesicular liposomes
AP129A (en) 1988-06-03 1991-04-17 Smithkline Biologicals S A Expression of retrovirus gag protein eukaryotic cells
JP3082204B2 (ja) 1988-09-01 2000-08-28 ホワイトヘッド・インスティチュート・フォー・バイオメディカル・リサーチ 両栄養性および環境栄養性宿主域を持つ組換え体レトロウイルス
US5217879A (en) 1989-01-12 1993-06-08 Washington University Infectious Sindbis virus vectors
EP0454781B1 (en) 1989-01-23 1998-12-16 Chiron Corporation Recombinant cells for therapies of infection and hyperproliferative disorders and preparation thereof
CA2045129A1 (en) 1989-02-01 1990-08-02 Alfred I. Geller Herpes simplex virus type i expression vector
JP3140757B2 (ja) 1989-02-06 2001-03-05 デイナ・フアーバー・キヤンサー・インステイテユート パッケージング欠陥hivプロウイルス、細胞系及びその使用
HU218717B (hu) 1989-03-17 2000-11-28 E. I. Du Pont De Nemours And Co. Nukleinsav-termelést fokozó növényi eredetű génfragmentek és eljárás előállításukra
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
DE69032284T2 (de) 1989-03-21 1998-10-08 Vical Inc Expression von exogenen polynukleotidsequenzen in wirbeltieren
HU212924B (en) 1989-05-25 1996-12-30 Chiron Corp Adjuvant formulation comprising a submicron oil droplet emulsion
ES2080153T3 (es) 1989-08-15 1996-02-01 Pasminco Australia Ltd Absorcion del vapor de cinc en el plomo fundido.
EP1001032A3 (en) 1989-08-18 2005-02-23 Chiron Corporation Recombinant retroviruses delivering vector constructs to target cells
US5585362A (en) 1989-08-22 1996-12-17 The Regents Of The University Of Michigan Adenovirus vectors for gene therapy
US5166057A (en) 1989-08-28 1992-11-24 The Mount Sinai School Of Medicine Of The City University Of New York Recombinant negative strand rna virus expression-systems
GB8919607D0 (en) 1989-08-30 1989-10-11 Wellcome Found Novel entities for cancer therapy
AU7007491A (en) 1990-02-02 1991-08-08 Schweiz. Serum- & Impfinstitut Bern Cdna corresponding to the genome of negative-strand rna viruses, and process for the production of infectious negative-strand rna viruses
NZ237464A (en) 1990-03-21 1995-02-24 Depotech Corp Liposomes with at least two separate chambers encapsulating two separate biologically active substances
CA2039921A1 (en) 1990-04-16 1991-10-17 Xandra O. Breakefield Transfer and expression of gene sequences into central nervous system cells using herpes simplex virus mutants with deletions in genes for viral replication
WO1991018088A1 (en) 1990-05-23 1991-11-28 The United States Of America, Represented By The Secretary, United States Department Of Commerce Adeno-associated virus (aav)-based eucaryotic vectors
US5149655A (en) 1990-06-21 1992-09-22 Agracetus, Inc. Apparatus for genetic transformation
CU22302A1 (es) 1990-09-07 1995-01-31 Cigb Secuencia nucleotidica codificante para una proteina de la membrana externa de neisseria meningitidis y uso de dicha proteina en preparados vacunales
EP0467714A1 (en) 1990-07-19 1992-01-22 Merck & Co. Inc. The class II protein of the outer membrane of neisseria meningitidis
WO1992005266A2 (en) 1990-09-21 1992-04-02 Viagene, Inc. Packaging cells
US5858725A (en) * 1990-10-10 1999-01-12 Glaxo Wellcome Inc. Preparation of chimaeric antibodies using the recombinant PCR strategy
WO1992007945A1 (en) 1990-10-30 1992-05-14 Dana Farber Cancer Institute Cell type specific alteration of levels of gene products in neural cells
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
SE9003978D0 (sv) 1990-12-13 1990-12-13 Henrik Garoff Dna expressionssystem baserade paa ett virus replikon
JP3337214B2 (ja) 1990-12-20 2002-10-21 アーチ・ディベロップメント・コーポレーション 電離線による遺伝子発現の調節
GB9115364D0 (en) * 1991-07-16 1991-08-28 Wellcome Found Antibody
JP3534749B2 (ja) 1991-08-20 2004-06-07 アメリカ合衆国 アデノウイルスが介在する胃腸管への遺伝子の輸送
FR2681786A1 (fr) 1991-09-27 1993-04-02 Centre Nat Rech Scient Vecteurs recombinants d'origine virale, leur procede d'obtention et leur utilisation pour l'expression de polypeptides dans des cellules musculaires.
NZ244306A (en) 1991-09-30 1995-07-26 Boehringer Ingelheim Int Composition for introducing nucleic acid complexes into eucaryotic cells, complex containing nucleic acid and endosomolytic agent, peptide with endosomolytic domain and nucleic acid binding domain and preparation
IL103059A0 (en) 1991-09-30 1993-02-21 Boehringer Ingelheim Int Conjugates for introducing nucleic acid into higher eucaryotic cells
US5252479A (en) 1991-11-08 1993-10-12 Research Corporation Technologies, Inc. Safe vector for gene therapy
WO1993010218A1 (en) 1991-11-14 1993-05-27 The United States Government As Represented By The Secretary Of The Department Of Health And Human Services Vectors including foreign genes and negative selective markers
GB9125623D0 (en) 1991-12-02 1992-01-29 Dynal As Cell modification
JPH07503372A (ja) 1992-01-23 1995-04-13 バイカル・インコーポレイテッド 生体外遺伝子導入
FR2688514A1 (fr) 1992-03-16 1993-09-17 Centre Nat Rech Scient Adenovirus recombinants defectifs exprimant des cytokines et medicaments antitumoraux les contenant.
WO1993025234A1 (en) 1992-06-08 1993-12-23 The Regents Of The University Of California Methods and compositions for targeting specific tissue
EP0644946A4 (en) 1992-06-10 1997-03-12 Us Health VECTOR PARTICLES RESISTANT TO HUMAN SERUM INACTIVATION.
GB2269175A (en) 1992-07-31 1994-02-02 Imperial College Retroviral vectors
AU692423B2 (en) 1992-09-25 1998-06-11 Institut National De La Sante Et De La Recherche Medicale Adenovirus vectors for the transfer of foreign genes into cells of the central nervous system, particularly in brain
EP0668913B1 (en) 1992-11-18 2002-01-30 Arch Development Corporation Adenovirus-mediated gene transfer to cardiac and vascular smooth muscle
EP0911413A3 (en) 1992-12-03 2000-11-15 Genzyme Corporation Minimal adenovirus-based gene therapy vector
US5478745A (en) 1992-12-04 1995-12-26 University Of Pittsburgh Recombinant viral vector system
US5348358A (en) 1993-02-22 1994-09-20 Selick David A Contact lens insertion tool
DE4311651A1 (de) 1993-04-08 1994-10-13 Boehringer Ingelheim Int Virus für den Transport von Fremd-DNA in höhere eukaryotische Zellen
JP3545403B2 (ja) 1993-04-22 2004-07-21 スカイファルマ インコーポレイテッド 医薬化合物を被包しているシクロデキストリンリポソーム及びその使用法
EP0733122A4 (en) 1993-05-26 1998-06-10 Us Health FUSION PROTEINS CONTAINING REP VIRUS PROTEIN ASSOCIATED WITH ADENOVIRUS AND BACTERIAL PROTEIN
FR2705686B1 (fr) 1993-05-28 1995-08-18 Transgene Sa Nouveaux adénovirus défectifs et lignées de complémentation correspondantes.
ATE304604T1 (de) 1993-06-24 2005-09-15 Frank L Graham Adenovirus vektoren für gentherapie
BR9405507A (pt) 1993-07-13 1999-05-25 Rhone Poulenc Rorer Sa Adenovirus recombinante defeituoso linhagem celular e composição farmaceutica
US5439808A (en) * 1993-07-23 1995-08-08 North American Vaccine, Inc. Method for the high level expression, purification and refolding of the outer membrane group B porin proteins from Neisseria meningitidis
EP0722493A1 (en) 1993-07-27 1996-07-24 THE WISTAR INSTITUTE OF ANATOMY &amp; BIOLOGY Modified dna virus vectors and uses therefor
US5631236A (en) 1993-08-26 1997-05-20 Baylor College Of Medicine Gene therapy for solid tumors, using a DNA sequence encoding HSV-Tk or VZV-Tk
US5362865A (en) 1993-09-02 1994-11-08 Monsanto Company Enhanced expression in plants using non-translated leader sequences
DK0814154T3 (da) 1993-09-15 2009-08-31 Novartis Vaccines & Diagnostic Rekombinante alfavirusvektorer
FR2710536B1 (fr) 1993-09-29 1995-12-22 Transgene Sa Usage anti-cancéreux d'un vecteur viral comportant un gène modulateur de la réponse immunitaire et/ou inflammatoire.
WO1995009654A1 (en) 1993-10-01 1995-04-13 The Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Gene therapy of the nervous system
DE69435223D1 (de) 1993-10-25 2009-09-03 Canji Inc Rekombinanter Adenoviren-Vektor und Verfahren zur Verwendung
RO116341B1 (ro) 1993-11-16 2001-01-30 Depotech Corp La Jolia Lipozom multivezicular si procedeu de obtinere a acestuia
US5693506A (en) 1993-11-16 1997-12-02 The Regents Of The University Of California Process for protein production in plants
FR2712603B1 (fr) 1993-11-18 1996-02-09 Centre Nat Rech Scient Virus recombinants, préparation et utilisation en thérapie génique.
WO1995015400A1 (en) * 1993-12-03 1995-06-08 The Johns Hopkins University Genotyping by simultaneous analysis of multiple microsatellite loci
JPH07241786A (ja) 1994-03-08 1995-09-19 Fanuc Ltd 産業用ロボットの制御装置
US6780406B1 (en) 1994-03-21 2004-08-24 The Regents Of The University Of Michigan Inhibition of vascular smooth muscle cell proliferation administering a thymidine kinase gene
US7252989B1 (en) 1994-04-04 2007-08-07 Board Of Regents, The University Of Texas System Adenovirus supervector system
WO1995029993A1 (en) 1994-04-28 1995-11-09 The University Of Michigan Gene delivery vector using plasmid dna packaged into an adenovirus and a packaging cell line
ATE381624T1 (de) 1994-05-09 2008-01-15 Oxford Biomedica Ltd Retrovirale vektoren mit verminderter rekombinationsrate
FR2720408B1 (fr) * 1994-05-31 1996-08-14 Pasteur Merieux Serums Vacc Fragments Tbp2 de Neisseria meningitidis.
DE69535178T2 (de) 1994-06-10 2006-12-14 Genvec, Inc. Adenoviren-vektor systeme und zelllinien
FR2723588B1 (fr) 1994-08-12 1996-09-20 Rhone Poulenc Rorer Sa Adenovirus comprenant un gene codant pour la glutathion peroxydase
IL117483A (en) * 1995-03-17 2008-03-20 Bernard Brodeur MENINGITIDIS NEISSERIA shell protein is resistant to proteinase K.
US5646259A (en) * 1995-03-24 1997-07-08 St. Louis University DNA encoding haemophilus adhesion proteins
WO1996037626A1 (en) 1995-05-22 1996-11-28 Chiron Corporation Position-specific integration of vector constructs into eukaryotic genomes mediated by a chimeric integrase protein
CU22559A1 (es) 1996-01-17 1999-05-03 Ct Ingenieria Genetica Biotech Sistema de expresión de antígenos heterologos en e. coli como proteínas de fusión
US5753235A (en) 1996-02-15 1998-05-19 Heska Corporation Recombinant canine herpesviruses
FR2751000B1 (fr) 1996-07-12 1998-10-30 Inst Nat Sante Rech Med Adn specifiques des bacteries de l'espece neisseria meningitidis, leurs procedes d'obtention et leurs applications biologiques
US5980898A (en) 1996-11-14 1999-11-09 The United States Of America As Represented By The U.S. Army Medical Research & Material Command Adjuvant for transcutaneous immunization
GB9726398D0 (en) * 1997-12-12 1998-02-11 Isis Innovation Polypeptide and coding sequences
WO1999036544A2 (en) 1998-01-14 1999-07-22 Chiron S.P.A. Neisseria meningitidis antigens
GB9810276D0 (en) 1998-05-13 1998-07-15 Smithkline Beecham Biolog Novel compounds
US6200576B1 (en) * 1998-07-15 2001-03-13 Development Center For Biotechnology Swine vesicular disease virus and mutant strains and preparation process and use thereof
EP1144998A3 (en) * 1998-10-09 2002-08-07 Chiron Corporation Neisseria genomic sequences and methods of their use
US6610306B2 (en) 1998-10-22 2003-08-26 The University Of Montana OMP85 protein of neisseria meningitidis, compositions containing the same and methods of use thereof
WO2000066741A2 (en) * 1999-04-30 2000-11-09 Chiron S.P.A. Conserved neisserial antigens
GB9916529D0 (en) * 1999-07-14 1999-09-15 Chiron Spa Antigenic peptides
WO2001055182A1 (en) 2000-01-25 2001-08-02 The University Of Queensland PROTEINS COMPRISING CONSERVED REGIONS OF NEISSERIA MENINGITIDIS SURFACE ANTIGEN NhhA
ES2281409T3 (es) * 2000-02-28 2007-10-01 Novartis Vaccines And Diagnostics S.R.L. Expresion heterologa de proteinas de neisseria.
GB0121591D0 (en) * 2001-09-06 2001-10-24 Chiron Spa Hybrid and tandem expression of neisserial proteins
GB0220194D0 (en) 2002-08-30 2002-10-09 Chiron Spa Improved vesicles
WO2010065473A2 (en) 2008-12-01 2010-06-10 Applied Materials, Inc. Gas distribution blocker apparatus

Also Published As

Publication number Publication date
ES2333071T3 (es) 2010-02-16
US20040126391A1 (en) 2004-07-01
CN1292820A (zh) 2001-04-25
DK1047784T3 (da) 2009-12-21
CY1114333T1 (el) 2016-08-31
EP2278011A2 (en) 2011-01-26
JP2009100781A (ja) 2009-05-14
PT1047784E (pt) 2009-12-21
WO1999036544A3 (en) 1999-10-14
DK1047784T4 (en) 2015-06-15
HK1030435A1 (en) 2001-05-04
EP1047784B1 (en) 2009-10-21
EP1047784A2 (en) 2000-11-02
SG152917A1 (en) 2009-06-29
JP2002508966A (ja) 2002-03-26
AU1979599A (en) 1999-08-02
US7714121B2 (en) 2010-05-11
JP4399112B2 (ja) 2010-01-13
ES2333071T5 (es) 2015-08-17
SG123535A1 (en) 2006-07-26
US20050287165A1 (en) 2005-12-29
WO1999036544A2 (en) 1999-07-22
EP2210945B1 (en) 2013-06-26
ATE446368T1 (de) 2009-11-15
EP2210945A2 (en) 2010-07-28
BR9906927A (pt) 2001-11-20
EP1047784B2 (en) 2015-03-18
CN1224708C (zh) 2005-10-26
DE69941567D1 (de) 2009-12-03
EP2210945A3 (en) 2010-11-17
US6709660B1 (en) 2004-03-23
CA2317815A1 (en) 1999-07-22
EP2278011A3 (en) 2012-03-07
CY1109708T1 (el) 2014-08-13

Similar Documents

Publication Publication Date Title
CN1224708C (zh) 脑膜炎奈瑟氏球菌抗原
CN1263854C (zh) 奈瑟球菌抗原
CN101293920B (zh) 脑膜炎奈瑟球菌抗原和组合物
CN100392082C (zh) 保守的奈瑟球菌抗原
CN101033467A (zh) 奈瑟球菌基因组序列及其用法
RU2281956C2 (ru) Антигенные пептиды neisseria
CN1617740A (zh) 抗沙眼衣原体的免疫
CN1416352A (zh) 含有脑膜炎奈瑟球菌b血清群外膜蛋白质的外膜囊(omv)疫苗
JP2011015684A (ja) 抗原性ナイセリアペプチド
JP2013078340A (ja) 抗原性髄膜炎菌性ペプチド
CN1433471A (zh) 85kgDa奈瑟球菌的抗原
CN1338005A (zh) 奈瑟球菌基因组序列及其用途
JP2004508801A5 (zh)
CN1911959A (zh) 奈瑟球菌基因组序列及其用途
CN1824675A (zh) 奈瑟球菌抗原
CN101298473B (zh) 保守的奈瑟球菌抗原
AU2003235364B2 (en) Neisseria meningitidis antigens and compositions
FRASER et al. Patent 2346713 Summary

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20050323