关键词:
联邦学习
生存分析
Cox比例风险模型
常微分方程
摘要:
临床医疗领域,单个医院的数据通常较少,导致统计推断不可靠,甚至无法进行统计分析。此外,由于伦理和法律等原因,不同医院的数据无法合并个体数据来分析。因此,联邦学习方法在近年来备受关注,因为它能够利用所有数据信息而不需要获取个体数据。联邦学习方法的成功在于目标函数可分,但是在生存分析中,经典的Cox 比例风险模型使用的部分似然方法并不适用于不可分样本,这限制了联邦学习方法的应用。本文借助常微分方程这一工具,提出了一种新的联邦学习方法,它基于极大似然方法,并回避了部分似然方法的不可分性。与传统的极大似然方法局限于特定参数模型不同,本文通过使用常微分方程和非参数样条工具,能够灵活地估计基准风险函数。本文从理论上证明了所提出方法得到的估计结果的相合性和渐近正态性。同时,证明了所提出方法得到的估计结果与与将所有个体数据合并后由部分似然得到的估计结果以概率1等价。此外,本文还证明了对于r阶常微分方程数值解法,当步长的收敛速度为O(n-1/r-c)时,数值逼近误差可以忽略。本文通过数值模拟与实证分析验证了所提出的方法的有效性。在保护个人隐私数据的前提下,该方法能够联合分析数据,提高数据分析的精准性。因此,它为生存分析中的数据分析和应用提供了一种新的思路和方法。