关键词:
数量性状位点
复杂性状
基因调控网络
变量选择
常微分方程
摘要:
生物复杂性状是一类由多基因控制,同时又受环境影响的性状。传统的全基因组关联分析(Genome-wide association study,GWAS)可在复杂性状的遗传作图研究中定位出与之相关的显著性位点。但是,该方法无法确定各个显著性位点之间在性状发育过程中具有怎样的互作关系,所以复杂性状的遗传结构还不是完全明了。随着系统生物学的发展,基因调控网络(Gene regulatory network,GRN)成为研究复杂性状的有效工具,特别是全基因(Omnigenic)网络模型的提出,为我们提供了将全部基因同时纳入研究以解释复杂性状完整遗传力的理论基础。然而,全基因网络模型尚停留在理论的阶段,国内外尚未报道一种切实可行的全基因网络构建方法。现有的诸多基因网络构建方法各具特色,但面对超高维的基因数据以及多时间的动态表型数据时,这些已有的方法均在全基因网络构建的实践中显现出各自的不足。针对该问题,本研究设计出一套常微分方程组系统,用以描述全部基因在数量性状完整发展过程中的互作关系,通过变量选择算法对各个微分方程进行横向的降维,通过参数估计方法的推导得到常微分方程系统中各个节点之间的定量互作关系,最终得到调控数量性状整个发展过程的稀疏的、有向的、带权的全基因调控网络。在此基础上,本研究进一步将该网络构建方法运用在拟南芥生长实验所得数据中:1)将计算所得拟南芥茎高生长全基因调控网络关系与KEGG PATHWAY数据库中已有数据进行比较,发现网络结果中可在数据库中验证的部分正确率达到90.21%;2)计算衡量各个微分方程拟合效果的判定系数,判定系数达到0.9以上的微分方程占总数的92.6%;3)针对所提出的全基因网络构建方法进行全面的计算机模拟分析,发现该方法中两个关键步骤的精确度分别可在一般实验条件下达到0.931与0.879。接着,本研究利用拟南芥GO数据库对所得到的全基因网络进行注释,得到拟南芥茎高生长过程中起关键作用的基因模块:对茎高生长起上调作用的关键基因模块为GO:0080179,GO:0010282,GO:0004846等,起下调作用的关键基因模块为GO:2001143,GO:0044599,GO:0052722等。最后,从三个层面解析拟南芥茎高生长全基因调控网络中的信息:1)解析单个SNP在全基因网络中的作用效应,提取网络中发挥单一功能的关键性节点,由此定位出在拟南芥茎高生长过程中分别发出上调、下调作用的关键基因AT1G37405和AT2G47550,接收上调、下调作用的关键基因AT3G55400和AT3G13750;2)解析SNP-SNP之间的作用关系,将全基因网络中的SNP按照各自作用关系分为8种类型,定位出以上8种类型的代表性关键基因;3)对各个SNP在拟南芥完整生长过程中发挥的功能效应进行聚类分析,从结果中推断各个SNP在茎高生长过程中的功能作用类型。本研究将上述具有特殊结构特征的位点进行详细的功能注释,以探索网络结构与基因实际生理功能之间的关联。本研究通过数据库对比以及计算机模拟实验说明所提出方法的有效性及精确性;实际数据的分析表明该方法具有可行性,且可为复杂性状的研究提供丰富的、清晰的基因互作信息。说明该研究发展的新方法为深入解析复杂性状的遗传结构提供了一种强有力的工具,为运用全基因调控网络研究未知功能的基因提供了新的方法和思路。