关键词:
B样条
非线性常微分方程
变量选择
基因调控网络
摘要:
基因调控网络(Gene Regulatory Network,GRN)是一种描述基因之间相互作用的复杂网络结构。在生物学中,基因调控网络描述了基因之间的调控关系,这些调控关系可以用网络来表示,其中基因可以被视为节点,调控关系可以被视为节点之间的边。基因调控网络的研究有助于理解基因调控的机制,揭示基因之间的相互作用关系以及在疾病发生和发展中的作用。在实验中,虽然可以发现基因之间的关系,但这只是完整关系中的一部分,难以重建完整的基因调控网络。因此,利用基因表达数据和已知的调控关系通过动态模型揭示基因之间潜在的关联性这一想法对于整合和重构GRN至关重要。
此外基因之间的关系并非只有简单的线性调控,非线性动态模型广泛用于表征控制复杂生物系统的过程,其中既涉及非线性泛函,也涉及双向相互作用。因此在本文中,我们探索了一种新的考虑交叉项的非线性常微分方程参数估计方法,针对带有交叉项的动态模型进行推断。对此本文开展的主要工作如下:
第一部分本文选择两阶段搭配方法,利用B样条基展开来近似函数的线性项,B样条曲面展开来近似交叉项,在第一阶段将最小二乘法和样条展开相结合得到基展开的估计。同时为了提高估计效率本文采用了积分估计,得到估计的基函数展开的积分。第二步中将积分结果代入Group LASSO模型,得到最终估计值。最后基于SIR型流行病学模型、经典Lotka-Volterra模型及其改进模型做数值模拟与传统非线性最小二乘法(NLS)和可分离非线性最小二乘法(SLS)进行比较,数值模拟结果表明本文提出的方法在处理非线性常微分方程参数估计问题中要优于NLS和SLS法。
第二部分考虑将本文提出的方法应用于酿酒酵母菌基因数据,重构酿酒酵母菌非线性基因调控网络。首先对基因数据进行聚类,识别出具有相同表达模式的共表达基因模块,并将识别到的基因模块数据用于本文提出的非线性常微分方程参数估计方法。最终得到酿酒酵母菌非线性基因调控网络,分析了不同基因模块之间的双向调控、共同调控和自调控等调控关系。基因的真实表达曲线图表明了该方法良好的估计效果,最终估计得到的非线性基因调控关系与单纯的线性调控关系相比结果更加丰富。