近期,二区主流杂志《BMC Genomics》刊登了一篇研究中药材苍术属植物叶绿体基因组变异及系统发育关系的论文。这篇文章仅仅用到了苍术属的6个代表种个体样本,文章分析结果丰富,研究投入产出高效。今天我们就来详细看一下这篇研究范文。
英文题目:Chloroplast genome variation and phylogenetic relationships of Atractylodes species
中文题目:苍术属植物叶绿体基因组变异及系统发育关系
背景:苍术(Atractylodes DC)是广泛使用的中草药植物,是东亚特有属。属内物种形态差异较小,通用DNA条形码无法清晰区分系统关系或识别属内物种。为了解决这些问题,我们利用高通量测序技术对所有苍术植物的叶绿体基因组进行了测序。
结果:结果表明苍术植物叶绿体基因组具有典型的四方结构,大小在152,294~ 153,261 bp之间。基因组共有113个基因,包括79个蛋白质编码基因、30个tRNA基因和4个rRNA基因。鉴定出了4个热点区,分别为rpl22-rps19-rpl2、psbM-trnD、trnR-trnT(GGU)和trnT(UGU)-trnL,以及总共42-47个简单序列重复(SSR)分子标记,这些被认为是最有希望进行物种划界和种群遗传研究的潜在变量标记。整个叶绿体基因组的系统发育分析表明,苍术是菜蓟的一个分支;苍术属物种形成了一个单系,清楚地反映了属内的关系。
结论:我们的研究包括了对苍术叶绿体基因组的序列和结构变异、系统发育和突变动态的研究,将有助于群体遗传学、分类学和物种鉴定的进一步研究。
叶绿体是具有独立遗传物质的多功能细胞器,常见于陆生植物、藻类和少数原生动物。细胞中叶绿体基因组有多种构型;最常见的结构是双链环状结构,包括一个小的单拷贝区和一个大的单拷贝区(LSC)。这两个区域被一对反向重复区域(IRa,IRb)分开,形成典型的四方结构。基因组大小范围从120到160 kb。与线粒体或细胞核基因组相比,植物叶绿体基因组在结构、基因数量和基因组成上具有更高的保守性。进化速度相对适中,介于核基因组和线粒体基因组之间。由于缺少重组,较小的基因组大小和高拷贝数,完整的叶绿体基因组序列已被广泛用于系统发育分析和物种鉴定。之前研究结果显示叶绿体基因组包含额外的信息来改进系统发育分析。比较叶绿体基因组序列提供了发现序列变异和鉴定突变热点区域的机会,同时也检测基因丢失和复制事件。从叶绿体基因组序列中获得的突变热点区域和单序列重复序列(SSRs)可以成为物种鉴定和群体遗传学的有效分子标记。
苍术是菊科东亚特有的一个小属,有6种,分布于中国、日本和朝鲜半岛。虽然苍术是一类中药的药用植物,但是其属之间和属内的关系一直是有争议的。该属的形态变异较大,传统的鉴定方法难以确定其亲缘关系(图1)。
图1、苍术属植物形态的比较。比例尺为5厘米。A A. carlinoides, B A. macrocephala, C A. lancea, D A. japonica, E A. coreana, F A. chinensis
植物总DNA提取并且质检合格后,通过超声波将总DNA随机打断,之后构建DNA文库,利用Illumina高通量测序平台进行PE150测序。
生信分析内容包括:测序数据质控、基因组组装及注释、微结构突变事件的分析、叶绿体基因组的比较和分歧热点识别、系统发育重建等。
用6种苍术样本获得10,016,902 – 44,594,826条原始读序,平均覆盖率为67X - 1431X (表1)。6个完整的叶绿体基因组的总大小从152,294 bp (A. carlinoides)到153,261 bp(A. macrocephala)。苍术叶绿体基因组具有典型的四方结构。
苍术叶绿体基因组有113个基因,其中蛋白编码基因79个,tRNA基因30个,rRNA基因4个(图2,表2)。
图2、苍术叶绿体基因组的基因图谱。大圆内侧基因顺时针转录,外侧基因逆时针转录。这些基因是根据它们的功能进行颜色编码的。虚线区域代表叶绿体基因组的GC组成
6个苍术叶绿体基因组共有114个Indels,其中30个与SSR相关(26.3%),84个与SSR无关(73.7%);74.6%的Indels存在于42个基因间区,7.0%的Indels位于外显子,18.4%存在于内含子(图3a)。非SSR相关Indels的范围从1到971个碱基,其中一个碱基是最常见的(图3b)。
图3、苍术叶绿体基因组的Indels分析。(A) Indels类型和位置的频率。(B)6个苍术叶绿体基因组中非SSR相关Indels的数量和大小
通过GMATA分析,在6种苍术属植物的叶绿体基因组中共检测到265个SSR。SSR的数量从42个(A. carlinoides)到47个(A. lancea)不等。SSR的类型和分布情况如图4所示。
图4、6个苍术叶绿体基因组中SSR的类型和分布。(A)在LSC、SSC和IR区域出现的频率。(B)SSR在不同物种中的分布比例。(C)SSR重复类型数量。(D)不同重复类型中已鉴定的SSR motif数量
在苍术的6个叶绿体基因组中进行了基于mVISTA的比较分析,以确定差异水平(图5)。结果表明叶绿体基因组具有高度的序列相似性,表明叶绿体基因组高度保守。IR区和编码区比单拷贝区和非编码区更保守。
图5、以A. chinensis为参照的6种苍术属植物叶绿体基因组的mVISTA可视化比对分析。x轴代表叶绿体基因组中的坐标。对齐区域的序列相似性在50%-100%
此外,我们还比较了叶绿体基因组、LSC区、SSC区和IR区的单核苷酸替换和核苷酸多样性(表3)。六个苍术叶绿体基因组与一个153,560个碱基对的矩阵进行比对,该矩阵有445个可变位点(0.29%)和31个简约信息位点(0.02%)。平均核苷酸多样性值为0.001。IR区的核苷酸多样性最低(0.0003),SSC区的多样性最高(0.0018)。
表3、苍术叶绿体基因组的可变位点分析
用DNAsp分析核苷酸多样性,以鉴定整个苍术叶绿体基因组中的突变热点区域(图6)。600 bp内的核苷酸多样性值在A组中从0到0.00656不等,在b组中从0到0.00633不等。rpl22-rps19-rpl2区域的Pi值最高(Pi= 0.00656),其次是其他三个间隔区(Pi> 0.005),包括A组数据集中的psbM-trnD、trnR-trnT(GGU)和TrnT(UGU)-TrnL;所有这些特征都位于LSC地区。
图6、整个叶绿体基因组的滑动窗分析。(A)所有六种苍术。(B)五种用于草药,不包括A. carlinoides。窗口长度:600 bp,滑动长度:100 bp。x轴:窗口中点的位置。y轴:每个窗口的核苷酸多样性
利用完整的质体序列,我们对37个朝鲜蓟族物种进行了系统发育分析。ML树和BI树的拓扑结构本质上是一致的(图7)。苍术是其他菜蓟属植物的姊妹种,苍术属植物形成一个100%支持的单系类群。
图7、基于来自37个不同物种的完整叶绿体基因组,使用最大似然法和贝叶斯推断法构建系统进化树。分支上方的数字代表最大似然自举值/置信区间后验概率
本研究对6种苍术属植物的叶绿体基因组进行了测序和组装,为该属植物提供了宝贵的基因组资源。基于整个叶绿体系统发育分析,属内的关系首次得到明确的解决。同时,叶绿体基因组的比较分析产生了可变区,这些可变区可以作为特定的DNA条形码。这些获得的遗传资源将为今后苍术的群体遗传学、物种鉴定和保护生物学的研究提供便利。