关键词:
生存分析
meta分析
神经网络
Stacking
前列腺癌
摘要:
前列腺癌是中老年男性最常诊断出的一种非表征性癌症,近年来,随着人们生活习惯、饮食习惯、环境的改变,我国前列腺癌的发病率呈现逐年上升且年轻化的趋势,目前根治性手术是早期前列腺癌主要治疗手段,但晚期转移性前列腺癌或去势抵抗前列腺癌尚无有效治疗手段,每年有大量的患者因为该疾病而死亡,因此对前列腺癌患者的生存分析就十分有意义,通过结合机器学习中较为成熟的算法模型,去提高前列腺癌患者生存分析预测准确度,当精准度达到可以用于实际临床辅助时,就可以为医生在为前列腺癌患者给出治疗方案时提供帮助。
本文在基于了解到的前列腺的腺体组织结构、腺体病理分区以及现行诊断和治疗方案等临床知识的基础上,从数据库中取出与前列腺癌相关的数据,如患者的年龄、种族、前列腺特异性蛋白(PSA)以及发生转移类型等前列腺癌患者数据,再根据临床医学数据的筛选标准,结合统计学上处理和分析数据方法,对数据进行预处理,得到想要特征及标准数据后,再对数据进行一些基础分析和假设验证,建立模型预测了前列腺癌患者在六个月之后的生存状态,并使用了四个指标对预测效果进行衡量,分别是C_index、AUC、nbll和brier分数。在模型方面,首先建立了Cox比例风险模型以及多个单一的机器学习模型,包括随机生存森林、GBM和神经网络模型,其次建立了多个连续时间和离散时间Cox+机器学习的模型,通过比较各种不同方法下模型的效果,选择表现最佳的两个模型作为初级学习器,在选择神经网络作为次级学习器构建了两个Stacking模型,分别是RSF_net模型,Meta_Stacking_Survival模型。
通过验证,本文所考虑的这两个模型在前列腺癌数据集上均取得了较好的预测效果,C指数最高可达0.8939,AUC值最高可达0.8803,brier得分最小为0.0154nbll分数最小为0.0106,同时本次实验所使用的所有模型都是在同一数据集下运行。结果表明,本文提出的融合模型对于拟合前列腺癌数据集具有更高的可靠性和准确率。