利用机器学习方法构建疾病预测模型文献综述

 2023-12-01 10:12

文献综述

1课题研究的现状及发展趋势

预测是为了适应社会经济的发展与管理的需要而产生并逐步发展起来的,作为一种社会实践活动,己有几千年的历史。可以说,自人类有文明历史以来,就存在预测活动。随着人类社会和科学技术的发展,预测的技术也得到不断发展,科学的预测能够准确地向人们展现未来。预测就是借助过去的探讨去推测、了解未来,是运用科学的判断方法或计量分析法,对目前尚未发生或目前还未明确的事物进行预先的估计和推测,是事物的发展和演变规律的认识和分析的过程,为正确地做出决策提供重要依据。实际上,预测就是这样一个过程:从过去和现在已知的情况出发,利用一定的方法和技术去探索或模拟不可知的、未出现的、复杂的中间过程,从而推断出未来的结果。它的意义主要表现在两个方面:一是了解事物未来的状况后,人们就可以在目前就为它的到来做好准备;二是通过预测可以了解目前的决策可能带来的后果,并通过对后果的分析来确定目前的决策,力争使目前的决策获得最佳的未来效果。所以预测问题是一个有着重大实际意义的课题,它涉及到人类生活的方方面面,从能源到环境、交通,从人口到经济、市场,从农田水利到航空航天,都会面对预测的问题。

随着人们物质生活水平的日益提高,人们生活的焦点也不再满足于关注衣食住行等最基本的方面。不仅仅各大门户类型的网站将“身体健康”作为其必须出现的热门板块,在微博、微信等社交平台中最热门的话题也出现了“身体健康”[1]。人们期待获得更优质的医疗服务。计算机技术的快速发展使得它已经广泛地应用于医疗领域的各个方面,然而,计算机技术主要用于病人医疗信息的采集、显示、存储等方面,疾病的诊断仍然主要由医生来确定。利用计算机进行辅助疾病诊断,实现智慧医疗,目前正处于开始发展阶段[2]。疾病模型的构建主要是对疾病的发病率、死亡率以及流行趋势进行预测, 但疾病的发生发展是一种复杂的现象, 必须不断纳入新兴学科知识, 来探讨疾病系统的特殊内在规律和描述方法[3]。如能有效提前预测出急性心肌梗死出院患者康复状况和严重不良事件发生,使医院、患者能够面对严重不良事件提前做出应对策略,这将是降低患者出院死亡率、致残率的有效途径。在国外,做过很多类似的死亡预测研究,但所开发的预测模型不是预测结果不一致就是预测准确率不够理想,并未给出一个确切的结论值得借鉴。在国内,将大数据和机器学习等技术应用到临床实践中仍处于探索甚至是起步阶段[4]

电子病历即基于计算机的病人记录, 是对医疗数据进行电子化保存、管理、传输和重现。电子病历的核心价值在于临床决策支持, 即应用统计分析、数据挖掘等方法, 辅助临床决策, 对疾病早期预警或特定结局事件发生监测起到重要作用[5]。体检的根本目的是以较小的代价,及时发现影响健康的苗头,指导慢病高风险人群控制风险因素,换取长期的健康状态[6]。在WoojaeKim的研究中认为,乳腺癌复发的预测是成功治疗的关键因素和后续计划[7]。现如今,机器学习发展迅猛,可以实现对大数据的分析与挖掘.机器学习是一门人工智能的科学,机器学习已经有了广泛的应用[8]。机器学习算法在处理较为复杂的问题上有较好的准确度和泛化能力。机器学习的研究目的是使用计算机模拟人类的学习活动,它是研究计算机识别现有知识、获取新知识、不断改善性能和实现自身完善的方法。人工神经网络、SVM是机器学习中的常用算法,因其各自特点及优势,有很多学者对它们进行了研究和探讨并将它们用于各类实验建模等[9]。如果使用现成的临床电子病历中的信息准确、及时和自动识别高危病人的临床恶化严重程度可以达到节省医疗资源和拯救生命的目的[10]

用机器学习方法构建预测模型有多种方法。Adaboost算法是针对多分类问题的一个扩展算法,使用加权分类错误率来衡量分类器的准确率[11]。AdaBoost 算法,由于其能显著地提高基分类器的准确率,是现在最流行的集成算法。这种算法通过 T 轮迭代,对弱分类算法进行集成,自适应地改变训练样本的分布,使得弱分类算法聚焦在那些很难分的样本上[12]。SVM是在统计学习理论基础上发展起来的一种新的机器学习方法,从结构分线最小化准则的角度保证了模型具有全局最优、最大泛化能力、推广能力强等优点,并能很好地解决许多实际预测问题,已成为机器学习领域颇有影响的成果之一[13]。随机森林算法是由Leo Breiman 于2001年提出的一种新型分类预测集成算法,该算法的实质是以决策树为基本分类器,将多个决策树进行组合来提高预测精度的集成学习模型。相对其他算法,随机森林对多元共线性不敏感,预测准确率高,不会形成过拟合,而且能处理维度很高的数据集,所以在众多算法中脱颖而出,成为目前研究和应用的热点。

2 本课题研究的意义和价值

随着医院信息化的建设, 电子病历其核心价值即临床决策支持将成为未来发展的方向。将计算机技术应用于疾病辅助诊断和预测,对于疾病的早发现、早治疗、减少误诊等方面具有很重要的意义。预测模型使流行病学研究获得的成果更好地与临床实践接轨,并通过高危筛检、临床循证指南等途径促进疾病的三级预防,降低疾病发病率和死亡率[14]。如果能通过流行病预测模型构建流行病预警系统的话,就能降低流行病爆发程度及对社会危害程度,节约社会医疗成本,有助于社会和谐与稳定,具有重要应用价值和社会意义[15]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。