基于RRA算法的跨平台基因列表整合策略文献综述

 2023-01-02 04:01

一.论文的背景和目的1.背景人类对恶性肿瘤发病规律、原因和机制的研究已持续了一个世纪之久, 从细胞癌变起源学说、细胞异常分裂、染色体易位、基因突变、表观遗传调控到遗传、进化、发育、代谢的信号调控网络, 提出了许多的假说, 同时也得到了数十项具有里程碑意义的重大科学发现, 比较全面地阐述了肿瘤细胞发生发展的生物学特性和临床转归。

肿瘤细胞的特征是获得无限增殖和失控性生长的能力, 逃避机体的免疫监视、以糖酵解代谢方式进行能量代谢、表现为返祖和去分化并以克隆性优势生长进行侵袭和迁移。

肿瘤细胞的这些生物学特征已脱离了机体正常细胞固有的基本特性和演化过程, 推测其必然存在决定性因素和遗传学基础. 因此, 从分子遗传学的角度研究肿瘤已经成为主流。

2.目的 将信息学技术应用在基因组数据分析上,已经在不同类型的癌症组基因中获取到了许多在癌症的形成,发展,转移起到关键作用的驱动因子。

三大数据库(TCGA,ICGC,GEO)收录了大量的癌症样本的基因组数据集,对这些公共实验数据的挖掘是的癌症的研究进入了新的时期。

然而基于不同平台数据的分析结论并不总是耦合,科学综合跨平台的实验分析结果才能获得最大效益。

因此本课题旨在利用一种鲁棒的秩聚合(RRA)算法,综合考虑同种癌症的问题在不同数据平台下差异表达的结果。

二.论文的理论依据和研究方法1.理论依据作为目前最大的癌症基因信息的数据库,癌症基因组图谱(the cancer genome atlas ,TCGA)公共数据集收录了包括29 种原位肿瘤类型,涉及基因组、转录组、蛋白质组及表观遗传等多层次的肿瘤数据,围绕TCGA 数据库的研究提高了人们对肿瘤发病分子基础的科学认识,同时提高我们诊断、治疗和预防肿瘤的能力;GEO(Gene Expression Omnibus)数据库,作为第一个基因表达数据的公共贮存库, 2000年7月在NCBI上首次公布于众,创建GEO的最初目的是适应高通量实验方法在将来的普遍发展,具有强大的数据收录功能,有着极大灵活性和与时俱进的设计风格,不需设立严格的登陆要求和标准;The International Cancer Genome Consortium(ICGC) 系统地、全面地描述50多种癌症类型和亚型的体细胞突变,为发展新的癌症疗法提供了最明确的途径。

这三个数据库采用不同的方法来研究相同的问题,为了得到最好的结果,我们需要很好的整合他们的成果,因此我们需要想到使用一种新的排序聚合方法来得到一个理想的结果。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。