栏目分类
热点资讯
Alchemix中文网
你的位置:IOTX 中文站 > Alchemix中文网 > 斑点叉尾鮰源嗜麦芽寡养单胞菌的全基因组测序及比较基因组学
斑点叉尾鮰源嗜麦芽寡养单胞菌的全基因组测序及比较基因组学
发布日期:2025-01-04 16:56 点击次数:137
嗜麦芽寡养单胞菌(Stenotrophomonas maltophilia)为需氧的革兰氏阴性短杆菌,广泛分布于环境、水体、植物,以及人和动物的消化道与呼吸道当中[1]。过去人们一致认为该菌毒力较弱,故其致病性不强,但随着研究的深入,该菌已被认定为重要的条件致病菌和医院临床感染菌[1]。临床微生物学家发现,多重耐药生物体(multiple-drug-resistant organisms,MDROs)对人类健康有极大的威胁,嗜麦芽寡养单胞菌是最近新发现的一种遍布全球的革兰氏阴性MDROs,它与人类呼吸道感染密切相关,还能引发各种危害人类健康的严重疾病[2]。该菌会造成绵羊的羊毛腐烂、饲养蛇类的传染性口腔炎、鳄鱼的败血症以及养殖卵形鲳鲹(Tranchinotus ovatus)的大规模死亡[3]。2004年以来,在四川、重庆、贵州等地的斑点叉尾鮰(Ictalurus punctatus)养殖区,出现了一种暴发流行性的传染病,病鱼以肠套叠为主要病理特征,并表现出体表褪色斑、腹水、肠炎和全身多器官败血症。该病的发病率和死亡率高达90%以上,造成了严重的经济损失[4]。 近年来随着测序技术的飞速发展,大量细菌的全基因组序列已被逐渐测得,截至目前,已经有超过5 000个测序项目在NCBI公布。早期的研究中,人们认为分析单个菌株的基因组足以涵盖研究所需的内容。而微生物在不同的生存环境中承受不同类型的生存压力,并通过基因组变异适应环境。后来发现比较多个细菌的基因组数据,能获得大量关于细菌物种生理特性和进化规律的信息。截至目前,比较基因组学已被广泛应用于微生物适应性和进化研究。 泛基因组是将同种细菌的不同菌株看作一株细菌,它是所有遗传信息的集合,可分为核心基因组和非必需基因组两部分[5]。核心基因组是包含了这一细菌种内的绝大部分菌株都携带的基因,决定了几乎所有个体菌株都具有的基本生物功能和表型特征。非必需基因组包含只在部分菌株中存在的基因和某个菌株的特有基因。其决定了细菌的毒力强弱、耐药情况、适应环境的能力甚至是摄取营养的方式,在泛基因组中占有很大的比例[6]。根据泛基因组大小与测序细菌的数目之间的关系,细菌泛基因组可分为开放性泛基因组(open pan-genome)和封闭性泛基因组(closed pan-genome)两类。开放性泛基因组是指在测定的基因组数量不断增加时,该物种的泛基因组的大小也会随之不断增加;封闭性泛基因组是指随着基因组数量的不断增加,泛基因组的大小增加到一定程度后就趋于稳定[5]。随着这一概念的提出,泛基因组已被逐渐应用于大肠杆菌(Escherichia coli)、肺炎链球菌(Streptococcus pneumoniae)等菌株的基因组进化分析[7-8]。 本研究对斑点叉尾鮰源嗜麦芽寡养单胞菌进行全基因组测序,同时与其他人源、动物源与环境源的嗜麦芽寡养单胞菌进行比较基因组学研究,为鮰源嗜麦芽寡养单胞菌病原学研究以及疾病预防和治疗提供理论支持。 1 材料与方法 1.1 菌株来源 嗜麦芽寡养单胞菌(S. maltophilia XH.SM.1)由四川农业大学鱼病研究中心保存并提供。菌株来源于2004年四川简阳,由汪开毓等[4]从患病斑点叉尾鮰肾脏中分离得到。 1.2 扫描电镜观察细菌超微形态 参照谢家仪等[9]的研究方法,离心收集沉淀,用PBS洗涤2次,每次5 min,用4%(W/V)的蔗糖溶液洗涤1次,时间为5 min,用系列梯度酒精脱水,30%、50%、70%、80%、90%、95%、100%,每梯度10 min。加入100%酒精重悬后,吸取少量悬液滴加在玻片上,将玻片轻轻粘在导电胶上,临界点干燥(K850,Quorum),真空喷镀(E-1045,日本),最后在镜下选择合适位置,适当倍数进行观察(Inspect,FEI)。 1.3 全基因组测序、组装及注释 按照TIANamp Bacteria DNA Kit细菌基因组DNA提取试剂盒(北京天根生化科技有限公司)步骤提取XH.SM.1基因组。基因组DNA用NanoDrop 2000(Thermo Scientific)核酸浓度检测仪检测纯度,确保OD260/280为1.8~2.0,浓度大于10 μg。 细菌基因组检测合格后首先构建基因组小片段文库(350 bp),然后利用Illumina公司的HiSeq 2500测序平台进行双末端测序,测序深度227 X。获得的原始数据去除引物、接头和筛除低质量的数据之后,使用SOAP denovo (Version 2.04)组装软件进行序列组装[10-11]。细菌基因组测序及前期的组装工作由北京诺禾致源科技股份有限公司完成。使用GeneMarkS软件对组装完成的基因组进行开放阅读框(open reading frame,ORF)预测,将得到的ORF翻译成氨基酸后与GO (Gene Ontology)、COG (Clusters of Orthologous Groups)和KEGG (KyotoEncyclopedia of Genes and Genomes)数据库进行Blast比对,完成蛋白序列功能注释。 1.4 基因组组分分析 使用SignalP[12](Version 4.1)、TMHMM (Version 2.0c)工具,预测XH.SM.1是否含有信号肽及跨膜结构以及蛋白序列是否是分泌蛋白。集中蛋白功能数据库注释结果,筛选与分泌系统相关蛋白进行单独注释,确定XH.SM.1中是否含有TNSS (Type N Secretion Systems)分泌系统。由于XH.SM.1为革兰氏阴性菌,可另外通过EffectiveT3软件[13](Version 1.0.1)预测T3SS效应蛋白。把XH.SM.1的氨基酸序列分别与VFDB (Virulence Factors of Pathogenic Bacteria)数据库[14]和ARDB (Antibiotic Resistance Genes Database)数据库[15]进行比对,得到毒力基因和耐药基因的注释结果。 1.5 共线性分析 下载NCBI上公布的10株完成图水平的嗜麦芽寡养单胞菌基因组序列,与XH.SM.1基因组进行Mauve (Version 2.1.0)共线性分析[16-17],由此得到多基因组比对结果,从而获得XH.SM.1在基因组层面上,与参考菌株在基因重排、缺失或者结构上面的差异。上传嗜麦芽寡养单胞菌 XH.SM.1基因组至IslandViewer 4[18],以嗜麦芽寡养单胞菌K279 a为参考菌株,预测XH.SM.1基因组中的特异性基因组岛。将预测结果通过NCBI BLAST进行同源性分析,下载分析结果再使用Easyfig[19](Version 2.1)绘制多个基因组基因座的线性比较图。 1.6 泛基因组分析与系统进化树构建 下载NCBI上公布的所有嗜麦芽寡养单胞菌基因组数据(截至2018-04-12,总共有350株),剔除Contig>250的菌株,剩下220株。使用Roary软件[20](Version 3.11.2)对测序菌株XH.SM.1和筛选过后的220株嗜麦芽寡养单胞菌进行基因组蛋白序列聚类分析,构建基因组间的基因集。NCBI参考基因组数据库(https://ftp.ncbi.nih.gov/genomes/refseq/bacteria/Stenotrophomonas_maltophilia/latest_assembly_versions/)。参考Tettlin等[5]的公式 $ {F_s}\left( {n} \right) =$ $ {{K}_{s}}{\rm{e}^ - }{^{{n}/\tau }}_{s} + {{\rm tan}} \theta $ 来对新基因数量 ${F_s}(n)$ 进行拟合,由该公式推导可得,当测序的基因组数目n大到一定程度时,新基因的数量为 ${\rm tan}\theta $ 。故 ${\rm tan}\theta $ 值的大小体现了该物种中新基因增加的数量,从而判定泛基因组是闭合或者开放。再从泛基因组比对结果中选取所有菌株的直系同源基因,MEGA 7.0构建系统发育树。 2 结果 2.1 扫描电镜观察 使用扫描电镜对菌体进行观察,在图1中可以清楚地看到XH.SM.1表面光滑、呈杆状或者短杆状,菌体周围可见包裹有分泌的糖类物质,未见鞭毛。在图1-d中随机选取测量10个菌体的长度和直径,通过和标尺的换算可得出XH.SM.1单个菌体长度为1.25~2.33 μm,平均长度(1.73±0.35) μm,菌体直径为0.36~0.50 μm,平均直径(0.43±0.04) μm。 图 1 嗜麦芽寡养单胞菌 XH.SM.1扫描电镜照片 (a)分泌物包裹着菌体;(b)菌体呈现两边钝圆的短杆状;(c)单个菌体附着少量分泌物;(d)菌体长度为(1.73±0.35) μm,直径为(0.43±0.04) μm Fig. 1 SEM photographs of S. maltophilia XH.SM.1 (a) secretions enveloping bacteria;(b) the bacteria show a short rod shape with rounded sides;(c) a small amount of secretion attached to a single cell;(d) the length of the bacteria is (1.73±0.35) μm and the diameter is (0.43±0.04) μm 2.2 基因组组装与注释 通过SOAP denovo软件完成序列拼接组装后,得到141个Scaffolds (>500 bp),组装后的基因组大小为4.56 Mb,GC含量为66.60%。将基因组上传NCBI,获得BioSample:SAMN08093584;BioProject:PRJNA419460;Assembly:GCA_003015035.1;GenBank:PYBO00000000.1。 将嗜麦芽寡养单胞菌 XH.SM.1预测基因的蛋白序列分别与GO、COG和KEGG数据库对比之后,获得了相对应的功能注释结果。共有11 060个基因从GO数据库中获得相应的功能注释,主要与结合、催化活胞和代谢过程有关(图2-a);共有3 680个蛋白获得COG的功能注释,主要与转录、信号转导机制、相关细胞膜合成相关(图2-b);在KEGG数据库注释的结果主要与信号转导、和氨基酸代谢有关(图2-c)。 2.3 基因组组分分析 预测嗜麦芽寡养单胞菌 XH.SM.1有593个信号蛋白(SignalP protein),1 016个跨膜蛋白(TMHMM protein),507个分泌蛋白(secreted protein)。编码基因共有4 087个,其中分泌系统效应蛋白的个数:T1SS 1、T2SS 16、T3SS 7、T4SS 10,其余为0。总共有4 087个革兰氏阴性菌的效应蛋白,其中预测为T3SS效应蛋白有137个,非T3SS效应蛋白3 950个。毒力基因选取一致性(Identity>70)较高的结果,分别为VF0082(Identity 82.6)、VF0273(Identity 76.2)和VF0159(Identity 72.1),它们的预测结果分别为Ⅳ型菌毛、鞭毛和热休克蛋白60。耐药基因的结果如表1所示,选取7个一致性在90以上的基因,其中6个基因与氟喹诺酮类耐药有关,1个与头霉素、头孢菌素、碳青霉烯和青霉素抗性相关。 表 1 嗜麦芽寡养单胞菌 XH.SM.1耐药基因预测情况 Tab.1 Drug resistance gene prediction of S. maltophilia XH.SM.1 2.4 基因组共线性分析 将嗜麦芽寡养单胞菌 SM.XH.1中141个Contigs重新排列成一条序列,然后通过Mauve共线性分析软件将其与来源NCBI的10株完成图水平嗜麦芽寡养单胞菌进行全基因组层面的共线性分析。结果如图3-a所示,XH.SM.1与10株嗜麦芽寡养单胞菌基因组共线性良好,高度相似,各scaffold之间匹配性较高。将XH.SM.1基因组上传IslandViewer 4,以嗜麦芽寡养单胞菌 K279a为参考菌株,总共得到3段特异性的基因组岛,上传基因组岛结果至NCBI通过BLAST进行同源性分析。结果中有一段长度大小为7.57 kb的序列,下载数据并用Easyfig绘制结果。如图3-b所示,SM.XH.1存在一段与ISMMS2、ISMMS2R和NCTC10257同源的基因簇,编码ABC转运器(ABC transporter ATP-binding protein)、外排RND转运蛋白周质适配子亚基(efflux RND transporter periplasmic adaptor subunit)、ABC转运蛋白透性酶(ABC transporter permease)、组氨酸激酶传感器(sensor histidine kinase)、DNA结合反应调节因子(DNA-binding response regulator)和细胞色素b (cytochrome b)6个蛋白。 图 3 共线性分析结果 (a)嗜麦芽寡养单胞菌 SM.XH.1与10株嗜麦芽寡养单胞菌菌株Mauve多序列对比(黑色箭头所指为嗜麦芽寡养单胞菌 SM.XH.1);(b)菌株可转移区域结构图 Fig. 3 Collinear analysis result (a) mauve multiple sequence alignment of S. maltophilia SM.XH.1 and 10 S. maltophilia strain (black arrow points to S. maltophilia SM.XH.1);(b) strain transferable region structure map 2.5 泛基因组分析与系统发育树构建 下载NCBI中嗜麦芽寡养单胞菌参考基因组数据库所有数据,剔除Contig>250的基因组,剩下220株。通过Roary软件进行泛基因组分析,得到结果如图4所示,根据Tettlin的研究公式推算出嗜麦芽寡养单胞菌泛基因组大小的拟合函数为F (x)=4 100.1x0.341 7–527.859 9, ${\rm tan\theta}$ 为–527.859 9,由此可以得到嗜麦芽寡养单胞菌的泛基因为开放性的结果。 图 4 泛基因组分析结果 (a) 220株嗜麦芽寡养单胞菌泛基因组特征曲线,图中上面的曲线为泛基因组特征曲线,下面的曲线为核心基因组特征曲线;(b) 220株嗜麦芽寡养单胞菌新基因组特征曲线;(c) 220株嗜麦芽寡养单胞菌特有基因组特征曲线 Fig. 4 Results of pan-genomic analysis (a) the number of core genome curve of 220 S. maltophilia, the upper curve in the figure is a pan-genome curve, the lower curve is the core genome curve; (b) the number of new genes of 220 S. maltophilia; (c) the number of unique genes of 220 S. maltophilia 嗜麦芽寡养单胞菌新基因和总基因随着测序菌株数量的增长而不断增加,核心基因的数量却在不断减少(图4-a)。新基因的数量在不断减少但不断有新基因被发现,其数量增长的趋势逐渐减缓,但并不为0(图4-b)。特有基因的数量随着测序菌株数量的增长而不断增长,呈上升的趋势(图4-c)。泛基因组分析得到总基因(1≤strains≤220)25 456个;核心基因(strains=220)716个;附属基因(2≤strains>220)17 457个;特有基因(strains=1)7 283个。综合以上结果可判定嗜麦芽寡养单胞菌基因组为开放型泛基因组,随着测序菌株数目的不断增加,该物种的泛基因组大小也会不断地增加。 根据220株嗜麦芽寡养单胞菌泛基因组分析的核心基因构建系统发育树(图5)。其中,菌株字体颜色的区别代表其地理位置的不同(黄色为亚洲,灰色为欧洲,橙色为美国),菌株字体背景颜色的区别代表其分离来源的差异(蓝色为人源临床分离株,绿色为环境源分离株,红色为SM.XH.1)。结果表明,SM.XH.1株与人源嗜麦芽寡养单胞菌G51株和环境源嗜麦芽寡养单胞菌EA22与EA63株聚为一枝,这表明他们之间的亲源关系较近。同时从图中可知,SM.XH.1株亲源关系与地理位置分布无关。 图 5 220株嗜麦芽寡养单胞菌基于核心基因构建的系统发育树 分叉处数值表示1 000次重复抽样所得到的置信度百分比,标尺长度表明每个位点发生0.01次置换 Fig. 5 Phylogenetic tree based on core genes of the 220 strains S. maltophilia The values at the forks indicate the percentage of trees in which this grouping occurred after bootstrapping the data (1 000 replicates),the scale bar shows the number of substitutions per site 3 讨论 嗜麦芽寡养单胞菌业已成为人畜共患的一种重要的条件致病菌,具有分布广和耐药性强的特点,其感染发病率和死亡率逐年上升,已引起人医学界和兽医学界的共同关注。斑点叉尾鮰源嗜麦芽寡养单胞菌基因组测序结果表明,SM.XH.1菌株组装后的基因组全长为4.56 Mb,GC含量为66.6%,预测有4 213个编码基因和4 083个蛋白。通过扫描电镜在10 000×、20 000×和40 000×倍下观察,可以清楚看到SM.XH.1为两端钝圆的短杆状细菌,菌体平均长度为(1.73±0.35)μm,平均直径为(0.43±0.04)μm。原本嗜麦芽寡养单胞菌是极生多鞭毛短杆菌,而电镜照片中没有观察到鞭毛,其原因可能为在电镜制作中前期清洗细菌时导致鞭毛脱落。 通过VFDB数据库预测到有3个可信度较高的毒力基因结果(Identity>70):Ⅳ型菌毛、鞭毛和热休克蛋白60。Ⅳ型菌毛(Tfp)是一种分布于细菌表面的强韧细丝状纤毛,主要表现对宿主的黏附作用,是革兰氏阴性菌致病的第一步[21]。作为细菌的运动器官,鞭毛是一种由蛋白质组成的细长弯曲的附属丝状物。其除了有运动和摄食功能之外,还参与对宿主的黏附、定居和入侵过程,与毒力作用密切相关[22]。热休克蛋白是广泛存在的一类热应激蛋白质,按照大小可分为HSP110、HSP90、HSP70、HSP60和smHSP 5类[23]。HSP60是一种在细胞保护方面发挥重要作用的分子伴侣,它能帮助不溶或变性的凝聚蛋白重新恢复天然构象,具有良好的抗原活性[23]。预测到的毒力因子大部分与细菌的黏附与定殖密切相关,这与嗜麦芽寡养单胞菌为环境常在的条件致病菌这一表型结果是相吻合的,细菌首先要在不同的环境下适应和定殖,然后才会有发挥毒力作用的可能性。 嗜麦芽寡养单胞菌产生多重耐药性重要原因之一是由于多重外排泵系统的存在[2],目前研究已在该菌上发现了Sme DEF和Sme ABC 2个多重外排泵系统[24-25]。其中Sme ABC是最早在嗜麦芽寡养单胞菌上发现的外排泵,与β内酰胺类、氨基糖苷类和氟喹诺酮类药物的耐药性相关,构建Sme ABC的缺失株可降低其对β内酰胺类、氨基糖苷类和氟喹诺酮等药物的耐药性[26]。Sme DEF属于耐药结节细胞分化(resistance-nodulation-cell division,RND)型外排泵,其在结构与功能上与Sme ABC类似,与氟喹诺酮类、氯霉素、四环素、大环内酯类药物的耐药性相关[27]。Bl3_l为B类β-内酰胺酶,与头孢菌素、碳青霉烯类抗生素和青霉素类药物的耐药性相关[28]。通过与ARDB数据库比对,预测到XH.SM.1一共含有33个耐药基因,其中有7个可信度非常高的结果(Identity>90),6个与氟喹诺酮类抗生素耐药相关,1个与头孢菌素、碳青霉烯类抗生素和青霉素有关。 运用Mauve软件进行全基因组多序列比对,可得出SM.XH.1与10株完成图水平的嗜麦芽寡养单胞菌在全基因组层面上的差异,直观地看出这11株菌基因组之间的不同点。新测序菌株可通过此方法对全基因组进行排序和比对,从多序列对比图当中看到SM.XH.1与10株嗜麦芽寡养单胞菌共线性良好,并无较大的基因缺失或者转移。 RND外排系统是革兰氏阴性菌中普遍存在的转运蛋白,它除了与耐药性相关之外还与细菌的定殖和毒力的发挥有很大的关系。ABC转运蛋白是细胞质膜上的一种运输蛋白,与维护细胞膜的功能和多重耐药性有关[29]。组氨酸激酶是细菌应对环境威胁的主要传感器,它与下游的应答调控蛋白一起组成了双组分信号传导系统,能应答环境中的氧还原位点、氧容量、光和小分子物质的变化[30]。DNA结合反应调节因子也是双组份信号传导系统的一部分,双组分系统允许细菌感知和响应许多不同环境条件的变化,对于细菌适应特定环境和毒力的发挥都是必要的[31]。细胞色素b在细菌中催化一些脂溶性的底物的羟化、去饱和及氧合等反应[32]。K279a株分离自菌血症死亡患者的血液中,测序结果表明其有9个RND外排泵,表现出显著的耐药性和重金属抗性[33]。ISMMS2与ISMMS2R株来自于同一位菌血症患者的血液中,在经过环丙沙星治疗9 d后,ISMMS2R相较于ISMMS2产生了对氟喹诺酮类药物的耐药性[34]。测序结果表明,2株菌的序列除了1个单核苷酸突变以外其余完全相同,此核苷酸突变位于Sme DEF操纵子中[34]。NCTC 10 257株来源于人体口腔,由NCTC (英国国家典型菌株保藏中心)上传。XH.SM.1基因组岛预测的结果中有一段与耐药和调节相关的基因,再经同源性分析发现该特异性基因组岛与耐药菌株同源。这与耐药基因的预测结果相互佐证,同时也说明了嗜麦芽寡养单胞菌有突变耐药和通过基因水平转移获得外源耐药基因的能力。 泛基因组的开放或者闭合反映了该物种在基因组成上的多样性程度,同时也体现了该物种生长环境的多样性以及与外界进行遗传物质交流的能力[35]。同为环境常在菌的大肠杆菌(Escherichia coli)也拥有一个开放性的泛基因组结果,并且大肠杆菌获得新基因的能力非常强[8]。分布在人体口腔和鼻腔的条件致病菌肺炎链球菌(Streptococcus pneumoniae)也拥有一个开放性的泛基因组结果[7]。开放的泛基因组结果说明嗜麦芽寡养单胞菌也具有良好的遗传物质交流能力,这与之前特异性基因组岛结果证明嗜麦芽寡养单胞菌能通过水平转移获得外源耐药基因的结果相互佐证。正因为嗜麦芽寡养单胞菌拥有一个开放的泛基因组,故其能摄取外源遗传物质来适应环境变化从而有利于自身的生存。因此该菌可以在各种环境中广泛分布,并在适当条件下发挥自己的毒力。根据不同宿主嗜麦芽寡养单胞菌的核心基因构建系统发育树,结果表明SM.XH.1与人源嗜麦芽寡养单胞菌G51株、环境源嗜麦芽寡养单胞菌EA22与EA63的亲源关系较近。此外,由于G51株分离自医院慢性感染患者血液,因此SM.XH.1具有潜在危害人体健康的风险。再加上其可能具有极强的耐药性与摄取外源性耐药基因的能力,故从事斑点叉尾鮰养殖的人员应该注意操作安全,对感染嗜麦芽寡养单胞菌的病鱼进行无害化处理。上一篇:区块链共识协议综述