叶绿体微卫星序列分析网站开发文献综述

 2022-08-03 10:47:56

枣转录组序列的微卫星

运用 Illumina 测序平台的 RNA-seq 技术对中秋酥脆枣的花、果实和枣吊进行了转录组测序,并对测序获得的 Unigene 进行微卫星特征分析。经序列组装和拼接,共获得 34 587 个 Unigene,运用 Misa 软件分析发现12 624 个微卫星。在所得转录组序列的单碱基至五碱基微卫星中,以单碱基微卫星最多(6 314 个,50.02%),并以 A/T(6 217 个,98.46%)为主要重复单元;二碱基微卫星(3 335 个,26.42%)次之,其中以 AG/CT(2532 个,75.92%)类型最多;再次是三碱基微卫星(2 871 个,22.74%);最后是四碱基和五碱基微卫星,二者仅占所有微卫星信息的 0.82%。单碱基微卫星所占比例最多,为枣最优势微卫星,而且其重复单元次数的变化明显高于其他重复类型,表明单碱基在整个枣转录组中变异最为活跃。
关键词:枣;转录组测序;RNA 测序;微卫星特征

1 材料与方法
1.1 植物材料
采集中秋酥脆枣的花、果实和枣吊作为实验材料,迅速于液氮中冷冻后,在 -80 ℃保存。
1.2 文库构建及转录组测序
采用 Ambion 试剂盒结合 CTAB 法提取各枣材料的总 RNA,RNA 等量混合后,构建 cDNA文库,而后用 Illumina 平台的 Hiseq 2000 RNASeq 技术对枣的转录组进行测序,再对其测序数据进行处理与分析,采用 Trinity 软件对 cleanreads 进行组装,通过序列之间的 overlap 信息组装得到 contig,再根据序列的 paired-end 信息和contig 之间的相似性对 contig 进行聚类,然后在局部进行组装得到转录本,最后从局部中挑选最长的转录本作为 unigene。对于多样品的组装,由于后续的表达丰度、差异基因分析等内容均建立在同一套参考基因的基础上,对样品间得到的基因序列作进一步的聚类,整合得到对应这个物种的 unigene 数据库。
1.3 转录组序列中微卫星的数据统计
采用 MISA 软件对组装获得的 Unigene 序列进行微卫星特征分析,查找重复基元包括:单碱基ge; 10 次,二碱基ge; 6 次,三碱基ge; 5 次,四碱基ge; 5 次,五碱基ge; 5 次,六碱基ge; 5 次的重复序列。在统计各重复序列时,将基序的所有可能的 1 移
码及其互补序列都视为同一个序列类型 [10-11]。

2 结果与分析
2.1 转录组测序组装结果及统计转 录 组 测 序 共 获 得 37 107 202 条 Clean
Reads, 对 Clean Reads 进 行 组 装 拼 接 获 得 2 098231 条 contig 序 列。Contig 序 列 长 度 主 要 分 布在 0 ~ 2 000 bp 之间,其中以 0 ~ 300 bp 序列数量 居 多, 约 占 总 contig 序 列 数 量 的 98.63%, 大于 2 000 bp 的序列数量约占总 contig 序列数量的0.2%。转录本(Transcript)长度主要分布在 200 ~2 000 bp 之间,在 1 000 ~ 2 000 bp 序列数量最多,约占总转录本数量的 27.98%。(见表 1)。
表 1 中秋酥脆枣转录组组装测序结果
Table 1 Assembly sequencing results of transcriptome of
Z.jujuba cv. lsquo;Zhongqiusucuirsquo;

长度范围 /bp Contigs 比例 Transcripts 比例

0 ~ 300 2 069 582 98.63% 11 522 17.29%
300 ~ 500 9 222 0.44% 10 507 15.77%
500 ~ 1 000 7 518 0.36% 13 713 20.58%
1 000 ~ 2 000 7 659 0.37% 18 644 27.98%
> 2 000 4 250 0.2% 12 241 18.37%
总数 / 个 2 098 231 66 627
总长 /bp 120 233 736 82 227 005
N50 长度 /bp 49 1 885
平均长度 /bp 57.3 1 234.14
组装拼接获得 34 587 条 unigene,序列长度主要分布在 200 ~ 3 000 bp 范围内,平均长度为953.25 bp,200 ~ 2 000 bp 序列数量最多,占全部unigene 序列数量的 87.47%,2 000 ~ 3 000 bp 的unigene 序列有 2 866 条,占全部 unigene 序列数量
的 8.29%,大于 3 000 bp 的 unigene 序列有 1 471 条,占 4.25%(见表 2)。
2.2 微卫星类型及数目统计
使用 Misa 软件,共发现 12 624 条微卫星重复序列,对枣转录组中单碱基至六碱基重复完整型微卫星和复合型微卫星进行分析发现,以完整型微卫星为主,共有 10 453 条,占总微卫星的 82.8%,而复合型微卫星只有 2 171 条,占17.2%。在完整型微卫星中,单碱基完整型微卫星(5 076 个,40.21%)最多,其次是二碱基完整型微卫星(2 788 个,22.08%)和三碱基完整型微卫星(2 501 个,19.81%),而四碱基和五碱基完整型微卫星最少(88 个,0.7%)。本研究中未发现六碱基重复的微卫星(见图 1)。

表 2 中秋酥脆枣的Unigene的长度统计
Table 2 Numbers and proportions of Unigene of Z.jujuba
cv. lsquo;Zhongqiusucuirsquo; in different lengths

长度范围 /bp 数量 比例
200 ~ 300 9 522 27.53%
300 ~ 400 4 816 13.92%
400 ~ 500 2 461 7.12%
500 ~ 600 1 741 5.03%
600 ~ 700 1 304 3.77%
700 ~ 800 1 153 3.33%
800 ~ 900 1 075 3.11%
900 ~ 1 000 977 2.82%
1 000 ~ 1 100 935 2.7%
1 100 ~ 1 200 835 2.41%
1 200 ~ 1 300 832 2.41%
1 300 ~ 1 400 778 2.25%
1 400 ~ 1 500 739 2.14%
1 500 ~ 1 600 711 2.06%
1 600 ~ 1 700 718 2.08%
1 700 ~ 1 800 614 1.78%
1 800 ~ 1 900 525 1.52%
1 900 ~ 2 000 514 1.49%
2 000 ~ 2 100 464 1.34%
2 100 ~ 2 200 391 1.13%
2 200 ~ 2 300 377 1.09%
2 300 ~ 2 400 304 0.88%
2 400 ~ 2 500 265 0.77%
2 500 ~ 2 600 267 0.77%
2 600 ~ 2 700 232 0.67%
2 700 ~ 2 800 230 0.66%
2 800 ~ 2 900 192 0.56%
2 900 ~ 3 000 144 0.42%
> 3 000 1 471 4.25%
总数 / 个 34 587
总长 /bp 32 969 902
N50 长度 /bp 1 656
平均长度 /bp 953.25

2.3 不同重复基序微卫星的频率
在 枣 转 录 组 微 卫 星 数 据 库 中, 共 有 12 624条微卫星序列。单碱基微卫星最多(6 314 个,50.02%),并以 A/T 类型为主;其次是以 AG/CT类型最多的二碱基微卫星(3 335 个,26.42%);再次是三碱基微卫星(2 871 个,22.74%);四碱基和五碱基微卫星最少,共有 104 个,只占所有微卫星信息的 0.82%

3 结论与讨论
(1)枣不同重复序列结构微卫星类型高通量 RNA-seq 测序具有高精度、不需要参考基因组信息、低成本、应用范围广等优势,尤其可为非模式植物转录组学的研究提供捷径。本研究利用 Illumina 高通量测序技术对枣转录组进行测序,共获得约 2 098 231 条 contig 序列和 34 587个 unigene 序列。而后再对 unigene 数据库得到的unigene 序列进行 SSR 标记开发的分析。按照微卫星重复序列结构的不同,将其分为完整型微卫星、不完整型微卫星以及复合型微卫星。完整型微卫星一般是由 1 种串联重复序列以不间断的重复方式构成的单一重复类型的微卫星;不完整型微卫星是指 2 个或 2 个以上的同种重复序列被 3 个或 3 个以下的非重复碱基分隔开;复合型微卫星指 2 个或 2 个以上的串联核心序列被 3个或者 3 个以上连续的非重复碱基所间隔,但这种连续性的核心序列重复数不得少于 5[12]。根据其重复序列结构的重复类型不同将微卫星重复序列进行分类,并对由此获得的 12 624 条微卫星重复序列中单碱基至六碱基重复完整型和
复合型进行分析得出:大部分为完整型微卫星,共有 10 453 条,占总微卫星的 82.79%;而复合型微卫星只有 2 171 条,占总微卫星的 17.2%。又针对完整型微卫星进行分析得出:以单碱基重复完整型微卫星为最多,其次是二碱基重复完整型微卫星,再次是三碱基重复完整型微卫星,四碱基和五碱基重复完整型微卫星最少,未发现六碱基。在枣的基因组序列微卫星特征研究中,六碱基重复微卫星出现的频率(40.1%)明显高于其他类型,之后依次为复合碱基(18.0%)、单碱基(17.1%)、四碱基(8.1%)、二碱基(7.5%)、三碱基(7.0%)、五碱基(2.2%)[9:83]。可见,枣转录组比基因组低级基元频率高,而高级基元比基因组的低。
(2)枣优势重复碱基类型分析本 研 究 中, 单 碱 基 微 卫 星 出 现 的 频 率
(50.02%)明显高于其他类型,其次是二碱基微卫星(26.42%),再次是三碱基微卫星(22.74%),四碱基微卫星(0.74%)和五碱基微卫星(0.08%)最少。从基元重复次数来看,枣微卫星数量随着重复次数增加而呈递减趋势,碱基重复次数越少,微卫星数量下降速率越快。其中以单碱基微卫星最为明显,二碱基微卫星次之,再次是三碱基微
卫星,四碱基微卫星和五碱基微卫星重复次数最少。单碱基微卫星集中在 10 ~ 23 次重复,二碱基微卫星是 6 ~ 12 次重复,三碱基微卫星是 5 ~8 次重复,四碱基微卫星是 5 ~ 6 次重复,五碱基微卫星仅集中于 5 次重复。通常认为 SSR 位点的变异频率与基元重复数存在一定的正相关,即重复次数越多,SSR 产生变异的可能性越大 [13]。本研究中单碱基重复微卫星为枣最优势微卫星,所占比例最多,而且单碱基微卫星重复单元次数的变化明显高于其他重复类型,其次是二碱基微卫星,这在一定程度上说明单碱基在整个枣转录组中变异最为活跃。
(3)枣优势重复单元碱基组成分析在 2 种单碱基重复微卫星中,以 A/T 为最主
要的重复单元;4 种二碱基重复类型是 AG/CT 重复的数量最多,其次为 AT/AT;10 种三碱基重复类型中 AAG/CTT 重复的数量最多,其次为 ATC/ATG 和 ACC/GGT,再次为 AAC/GTT、AAT/ATT和 AGG/CCT,其他重复碱基则相对较少;在 18种四碱基重复类型中, AAAT/ATTT 的重复数量最多,其次是 AAAG/CTTT;五碱基重复类型有 9种,AAAAT/ATTTT 重复的数量最多。由此发现枣不同重复碱基类型优势重复单元的共同特点是富含 A 和 T 碱基。不同植物中优势重复单元不同:杜仲转录组微卫星中,出现频率高的 2 个重复类型 是 AG/TC 和 CT/GA, 其 次 是 AC/TG 和 AGA/TCT[14];南方红豆杉转录组中,出现频率高的重复类 型 是 AAG/CTT、AGG/CCT、AGC/CTG、ATC/ATG、AG/CT、AT/AT[15]。 同 一 物 种 不 同 组 织 器官优势重复单元不同:在茶树转录组微卫星中占优势的前 3 种重复类型是 CT/AG 、TC/GA 和 AT/TA,其次是 A/T[16];在茶树花转录组中单碱基至六碱基重复单元中出现频率最高的类型分别是 A/T、AG/CT、AAG/CTT、AAAG/CTTT、AAAAT/ATTTT 和 AAAAAC/GTTTTT[17]。在微卫星重复序列中,如 CA、GA、GT 等重复可以通过影响 DNA 的结构而影响 DNA 重组,因此微卫星中的重复单元碱基组成在很大程度上会影响生物的生命活动 [18]。造成不同植物基因组中不同重复碱基类型及重复单元偏好性的原因除了与不同物种间的真实微卫星信息差异有关外,可能还与不同微卫星查找工具中的参数设置有一定关系 [19]。
(4)微卫星技术在枣研究中的应用前景微卫星序列广泛分布于真核生物基因组的编码区和非编码区,通过对枣转录组中微卫星序列特征的分析,对开发大量高效的微卫星分子标记提供了重要的信息资源,另外对于在转录组序列中发掘的微卫星序列,它是具有基因功能的序列,有助于开发出枣的重要基因关联的微卫星标记。本研究中所得到的枣转录组微卫星对以后该物种的进化、遗传多样性、枣品种的鉴别及分子标记辅助育种等方面的研究奠定基础。

参考文献:
[1] 原勤勤 , 文亚峰 , 刘 儒 , 等 . 枣优良品种亲缘关系的 ISSR分析 [J]. 经济林研究 , 2012, 30(1): 56-61.
[2] 王永康 , 田建保 , 王永勤 , 等 . 枣树品种品系的 AFLP 分析[J]. 果树学报 , 2007, 24(2): 146-150.
[3] 智福君 , 贾彦丽 , 梁海永 , 等 . 利用 RAPD 技术进行枣树的品种鉴定 [J]. 华北农学报 , 2009, 24( 增刊 ): 110-114.
[4] 麻丽颖 , 孔德仓 , 刘华波 , 等 . 36 份枣品种 SSR 指纹图谱的构建 [J]. 园艺学报 , 2012, 39(4): 647-654.
[5] Mrazek J, Guo X, Shah A. Simple sequence repeats inprokaryoticgenomes [J]. PNAS, 2007, 10(4): 8472-8477.
[6] 许靖诗 , 乌云塔娜 , 叶生晶 , 等 . 梨种质资源 SSR 引物的筛选与评价 [J]. 中南林业科技大学学报 , 2012, 32(7): 80-85.
[7] Kashi Y, King D G. Simple sequence repeat as advantageousmutators in evolution [J]. Trents in Gentic, 2006, 22(5): 253-259.
[8] Lawson M J, Zhang L. Patterns of SSR distribution in theArabidopsis thaliana and rice genomes [J]. Genome Biology,
2006, 7(2): R14.
[9] 马秋月 , 戴晓港 , 陈赢男 , 等 . 枣基因组的微卫星特征 [J]. 林业科学 , 2013, 49(12): 81-87.
[10] Jurka J, Pethiyagoda C. Simple repetitive DNA sequence fromprimates: complication and analysis [J]. Joumal of Molecular
Evolution, 1995, 40(2): 120-126
[11] Cardle L, Ramsay L, Miboume D, et al. Computional andexperimental characterization of physically clustered simple
sequence repeats in plants [J]. Genetics, 2000, 156(2): 847-854
[12] Weber J L. Informativeness of human (dC-dA) nrsquo; (dG-dT) nPolymorphisms [J]. Genomics, 1990, 7(4): 524-530.
[13] Schlouml;tterer C. Evolutionary dynamics of microsatellite DNA [J].Chromosoma, 2000, 109(8): 365-371.
[14] 黄海燕 , 杜红岩 , 乌云塔娜 , 等 . 基于杜仲转录序列的 SSR分子标记的开发 [J]. 林业科学 , 2013, 49(5): 176-181.
[15] 李炎林 , 杨星星 , 张家银 , 等 . 南方红豆杉转录组 SSR 挖掘及分子标记的研究 [J]. 园艺学报 , 2014, 41(4): 735-745.
[16] 杨 华 , 陈 琪 , 韦朝领 , 等 . 茶树转录组中 SSR 位点的信息分析 [J]. 安徽农业大学学报 , 2011, 38(6): 882-886.
[17] 王丽鸳 , 韦 康 , 张成才 , 等 . 茶树花转录组微卫星分布特征[J], 作物学报 , 2014, 40(1): 80-85.
[18] Biet E, Sun J S, Dutreix M. Conserved sequence preference inDNA binding among recombination proteins: an effect of ssDNA
secondary structure [J]. Nucleic Acids Research, 1999, 27(2):596-600.
[19] 阎毛毛 , 戴晓港 , 李淑娴 , 等 . 松树、杨树及桉树表达基因序列微卫星比对分析 [J]. 基因组学与应用生物学 , 2011, 30(1):103-109

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。