现代结核病诊断技术
上QQ阅读APP看书,第一时间看更新

第四节 结核分枝杆菌的基因组学

1998年英国Sanger中心和法国Pasteur研究所合作完成了对结核分枝杆菌H37Rv菌株全基因组测序工作,结核分枝杆菌基因组大小为4.4Mb,预测含4411 个开放阅读框(ORF)。其中3924个ORF被认为编码蛋白质,50个基因编码稳定的RNA。结核分枝杆菌基因组G/C含量高达65.6%。基因组编码蛋白质的10%为PE(脯氨酸和谷氨酸重复)和PPE(脯氨酸、脯氨酸和谷氨酸重复)蛋白质家族。在初期的功能注释中,结核分枝杆菌基因表达产物中40%为有功能的蛋白质产物,另外44%与基因组其他信息有关,这当中大多是“保守且功能假定的序列”(即它们在其他细菌中也存在但其功能未知),还有16%则完全未知且仅存在于结核分枝杆菌和其他分枝杆菌属中。
2002年,Camus等根据新的实验数据和序列比对信息,对结核分枝杆菌H37Rv 菌株的基因组进行重新分析并加以注释。他们在原先基础上又发现82 个能够编码多肽的新基因。基于和已有基因组序列的比较以及来自其他文献的实验数据,确定了2058 个蛋白质的功能,预测出376 个蛋白质与已知蛋白质不具同源性,是结核分枝杆菌所独有的。随后,Leischmann等完成了临床分离得到的结核分枝杆菌CDC1551 菌株的基因组测序并将其与H37Rv菌株进行了全基因组比较,他们发现H37Rv 和CDC1551 菌株的基因组间有显著的不同。在CDC1551和H37Rv菌株基因组中存在1075个SNP,约85%的替换发生在编码区。相对于CDC1551 菌株基因组,H37Rv菌株基因组中有37个插入片段(长于10 bp)。而相对于H37Rv菌株基因组,CDC1551菌株基因组则有49个影响着ORF的插入序列,其中14个位于基因间。所有这些插入事件除了串联重复、ORF 两末端序列增多外,还导致增多了17个完整的ORF。研究表明,相近的IS6110 插入序列之间发生的同源重组事件可能导致基因组序列的缺失进而引起基因组的多样性,研究人员在CDC1551菌株基因组中鉴定出4个拷贝的IS6110插入序列。而在H37Rv菌株基因组中,却有16个拷贝的IS6110 插入序列。
从历史进程上来说,结核分枝杆菌H37Rv 和H37Ra两菌株都是来源于它们共同的有毒亲本H37,该菌株于1905年从一个慢性肺结核病人体内被分离到,H37Rv 菌株一直在实验室作为标准菌株使用并保持毒力,而H37Ra 菌株由于经过多次传代而丧失了毒力。国家人类基因组南方中心于2008年完成了对H37Ra 菌株的全基因组测序,同时对H37Rv 进行部分序列的测定,运用比较基因组学方法,试图解释H37Ra 菌株毒力丢失的原因。测序和比对结果表明,结核分枝杆菌H37Ra 与H37Rv 菌株基因组之间有高度的保守性,但由于存在53个插入和21个缺失事件,前者比后者基因组多8445 bp。研究表明,CDC1551 菌株更接近于H37 菌株,故以CDC1551菌株基因组为标准,比对出130 个H37Ra特异性的基因组变异,共涉及57 个基因。鉴于结核分枝杆菌不同菌株基因组差异的存在,有研究者用动物模型来实际考察不同菌株的致病性差异。Claudia等选取CDC1551、HN60、HN878、H37Rv 和Erdman 菌株,构建小鼠吸入感染模型,发现在感染后的早期生长阶段,各个不同处理下,除了Erdman 菌株,其他各菌株生长速率相似,随后,CDC1551 生长速率相对下降。相对于其他小鼠而言,受CDC1551 菌株感染的小鼠肺部产生的肉芽肿中有较高水平的TNF-α、IL-6、IL-10 和IL-12 表达量,并且IFN-γ的mRNA 表达也有所提高。CDC1551 菌株感染的小鼠生存期较其他处理的小鼠明显要长,在人类单核细胞中,CDC1551菌株和H37Rv 菌株生长速率相同,可是前者引起人类单核细胞表达更多的TNF-α、IL-6、IL-10和IL-12 等细胞因子。从体内外的生长速率来看,CDC1551菌株并不比其他菌株更具毒性,但其确实能引起寄主更迅速且强烈的免疫反应,虽然H37Ra和H37Rv菌株基因组高度相似,但二者表型完全不同,这表明H37Ra 菌株基因组发生了一些可以影响其毒力和生长特征的突变。结核分枝杆菌SigC可以调控至少38个与细胞代谢过程有关的基因表达,sigC基因的缺失使得H37Rv菌株对小鼠的毒力明显下降,在H37Ra 菌株基因组中发现预测的sigC启动子区域有A-T的颠换,qRT-PCR研究表明,在对数生长期的体外培养结核分枝杆菌H37Ra 菌株中,该基因表达上调,但在巨噬细胞中,该基因表达却下调。在H37Ra菌株中,MazG含一个错义突变,导致在其高度保守的218PAL(Pro-Ala-Leu)基序处发生A219E替换,这一基序处于预测的一个保守的螺旋结构内,该结构加上其他3个螺旋结构,共同构成了MazG的焦磷酸水解酶的活性部位。