题目:The development of SSR markers based on RNA-sequencing and its validation between and within Carex L. species基于RNA测序的SSR标记的开发及其在苔草种间和种内的验证
发表期刊:BMC Plant Biol.
发表时间:2021-1-6
影响因子:3.497
苔草属(Carex L.)是莎草科最大的属之一,也是生态系统中重要的维管植物。但苔草的遗传背景复杂,分类不明确。为了研究苔草的基因功能注释,进行了RNA-seq分析。根据Illumina的测序数据生成SSR,然后用于研究79份苔草种质的遗传特性。在本研究中,共获得36,403个单基因,总长度为41,724,615 bp,并基于GO、KOG、KEGG、NR数据库进行注释。在8776个SSR中,随机选择了96对引物。42对多态性较高的引物共扩增出180条多态性带。每个引物的平均条带数为4.3,平均距离值为0.548,多态信息含量为0.133-0.494。观察到的等位基因数(Na)、有效等位基因数(Ne)、Nei's基因多样性(H)和Shannon信息指数分别为2.000、1.376、0.243和0.391。NJ聚类分为三组,来自新西兰的材料表现出相似的遗传属性,聚类成一组。UPGMA和PCoA分析也显示了相同的结果。AMOVA分析表明,基于地理起源聚类和NJ聚类的种内遗传多样性优于种间遗传多样性。此外,本研究还建立了79种苔草的指纹图谱。引物对的不同组合可以一次鉴定多种苔草,克服了传统鉴定方法的困难。转录组分析从基因注释中揭示了新的功能类别。遗传特征分析表明,79种苔草属植物间存在广泛的基因流动。这些标记可用于调查苔草和相关物种的进化史,以及作为未来育种项目的指南。
RNA-seq及从头组装
使用HiSeq2000平台对青绿苔草的转录组进行测序。总共获得了43.67Gb的数据。每个样本的数据达到6.32Gb,Q30百分比超过94.03%。总共有36,403个单基因,其中12,657个单基因的长度超过1 kb。单基因的N50为2016,表明具有很高的组装完整性。
基于不同数据库的基因注释
根据序列的同源性分析,将11,629个单基因(31.95%)分为三个主要的GO类和50个子类。根据KOG数据库,将11,871个单基因分为25个功能组,并将20.52%的单基因注释为“一般功能”群。基于KEGG数据库,总共发现了8440个单基因,包括属于五个大类(细胞过程,遗传信息处理,环境信息处理,代谢和生物系统)的40条生物途径(图1)。
基于NCBI非冗余核苷酸数据库,E值分布显示有23.00%的单基因搜索到结果(图2a),约35.00%的单基因表现出大于80%的同一性(图2b)。NR蛋白序列比对结果显示,21.69%可与菠萝属植物比对,10.10%可与杜鹃花属植物比对,8.03%可与凤凰属植物比对(图2c)。
转录组中SSR的频率和分布
使用MISA软件共扫描了36,403个单基因,检测到8776个SSR位点(表1)。转录组中的SSR位点有六种类型,每种重复类型的数量差异很大。
SSR的开发及评价
我们设计并合成了96对引物来扩增11个表型差异材料,其中42对(43.75%)可扩增多条条带,多态性高。引物表明不同苔草属物种之间具有良好的可转移性。未扩增条带数占15.6%,其余多态性较低或无多态性。
遗传多样性统计
在42个SSR中,我们识别了79份材料中的180个标记等位基因。42个SSR中,PIC值在0.133 ~ 0.494之间,平均为0.259。SSR在不同材料间表现出较大的遗传变异。采用聚类分析、主成分分析对苔草材料间的遗传多样性进行了研究。平均每个引物扩增出4.3条引物。观察到的等位基因数(Na)、有效等位基因数(Ne)、Nei(1973)基因多样性(H)和Shannon信息指数(I)分别为2.000、1.376、0.243和0.391,表明苔草种间的遗传多样性较高。
基于SSR标记的苔草属植物聚类分析
为了揭示苔草属物种的分类信息,我们根据原始数据获得了等位基因频率。我们使用NJ、PCoA和UPGMA聚类分析,而不是使用种源或分类等先验分类,并结合这些结果来探索所有材料的遗传信息和分类。
主坐标分析(PCoA)结果得到了两组遗传分化的苔草属材料(图4)。第一主成分占29.6%,第二主成分占19.8%。
图4、苔草属79种样本的PCoA分析。第一主成分占29.6%,第二主成分占19.8%。红色菱形代表中国的种质资源,绿色正方形代表新西兰的种质资源,蓝色三角形代表北美的种质资源,黄色圆圈代表德国的种质资源。
在SSR原始数据的基础上,采用Dice系数法计算相似度。采用UPGMA法对79份材料进行聚类分析(图6)。基因型间的相似度为0.070 ~ 0.786。通过UPGMA聚类,将79份种质资源分为两大类。关于苔草的收集来源,中国与新西兰、德国和北美的苔草种质之间存在一定程度的基因交换。然而,总的来说,资源不能完全按地区分配。相关系数r = 0.941,表明聚类结果可靠。
为了评估这些种质之间的遗传差异,我们计算了所有材料对之间的FST值。通过不同来源的分析,AMOVA表明79份材料的总遗传变异中88%在群体内,12%在群体间。AMOVA分析结果显示,部分亚种在国家间存在较大差异,这与上述不同国家材料的结果一致。而基于NJ聚类分析的AMOVA分析结果显示89%在人群内(表2)。
转录组分析为注释基因的功能分类提供了新的思路,并将有助于未来基因功能研究。遗传背景分析表明,基因流在79个苔草物种中广泛存在。这些标记物可用于评估遗传多样性,并研究苔草和相关物种的进化史,以及在将来的育种项目中提供指导。
往期文章链接:
转录组学:
别愁文章啦!做个无参转录组测序+SSR标记开发,发篇6分文章不香吗?;
全转录组测序在植物研究中的应用(黄瓜、番茄、大白菜、泡桐、拟南芥、茶树、胡杨、玉米);
一套RNA-Seq数据发两篇文章,这篇5分文章可能被你漏掉了;
PNAS | 代谢组+转录组揭示生物脱水胁迫耐受性的关键分子机制;
转录组Plus | 2020年11月研究进展:肝炎、红斑狼疮、病毒-真菌共感染和珊瑚漂白等;
转录组Plus | 基因组+转录组除了分析eQTLs,sQTLs也别漏下;
转录组Plus | 2020年9月研究进展(一):蒙古人肝癌、胰腺癌、果实发育、猪基因组印记等;
转录组Plus | 2020年8月研究进展(一):心脏器官发生、痴呆、哮喘、家蚕氟暴露、水稻病毒响应及苹果采后保鲜;
创新基因科技,成就科学梦想