关键词:
上游开放阅读框
翻译调控
靶点基因
摘要:
研究背景与目的在真核生物体内,以DNA作为模板合成RNA的过程称为转录。绝大多数细胞体内的RNA主要包括三大部分:信使RNA (messenger RNA, mRNA)作为翻译的模板,指导蛋白质的生物合成;核糖体RNA(ribosomeal RNA, rRNA),与核糖体蛋白一起形成核糖体在mRNA上进行扫描,成为蛋白质翻译的场所;转运RNA (transfer RNA, tRNA),作为适配器根据mRNA上密码子携带相应的氨基酸进入到核糖体内参与多肽链的组装。此外,还有一些核小RNA(sn RNA)和微小RNA(mi RNA)分别与mRNA的剪切和基因表达调控有关。可见,mRNA在蛋白质生物合成中占据着举足轻重的地位。基因的表达是一个十分复杂过程,一个基因能否表达以及表达量的高低,在很大程度上受到多个层次、多方面水平调控,从DNA的复制,RNA的转录,mRNA的剪接加工,蛋白质的翻译,到翻译后的修饰等均可参与基因的表达调控。其中,转录后的调控机制是研究较为透彻的。刚转录出来的前体mRNA (precursor mRNA)必须完成加工剪接后才能成为成熟mRNA (Mature mRNA)并作为模板指导蛋白质生物合成。在真核细胞中,一个成熟的mRNA包括5’端的7-甲基鸟嘌呤的帽结构,5’端的非翻译区(5’untranslated region,5’UTR),编码蛋白质的翻译序列,3’端的非翻译区(3’untranslated region,,3’UTR)和PolyA尾。作为成熟mRNA的一部分,在5’UTR内存在着一些可以影响下游蛋白编码区—主要开放阅读框(main open reading frame, mORF)翻译的顺式作用元件,例如某些较长的5’UTR序列可能会形成妨碍核糖体在mRNA上扫描的二级结构、与不依赖帽结构(Cap-independent translation initiation)参与翻译相关的内部核糖体进入位点(internal ribosome entry sites, IRESs),发夹结构,某些蛋白结合位点以及上游开放阅读框(upstream open reading frame, uORF)。到目前为止,作为翻译调控元件的uORFs的研究是最为广泛,据文献报道,uORF普遍存在哺乳动物的转录本中,大约49%的人类基因和44%的小鼠基因转录本的5’UTR中至少包含有一个uORF。研究表明,uORF可以通过多种调控机制减低对下游基因翻译起始的效率或是引发mRNA的降解来对蛋白表达产生抑制作用。这些调控机制主要涉及到uORF的长度、个数、序列在物种间的保守性、与5’末端帽结构相对位置、与下游编码序列的距离以及uAUG周围的序列文本。研究还表明,uORFs序列上位点的多态性会影响基因的表达,这可能会与人类疾病表型存在一定的相关性。例如凝血因子Ⅻ,该基因的uORF上存在一个等位基因的C/T的多态性位点,其中含有碱基T的那条等位基因的经体外实验验证蛋白表达降低了大约50%。这说明,自然发生在uORF上多态性似乎能够改变下游基因的表达。此外,已有的文献还报道,来自遗传与生物信息学的研究表明,某些人类疾病的发生与uORFs序列上突变有着密切关系,突变的发生可以导致uORFs的产生或消失,显著影响下游基因的表达。其中已报道的由多态性或突变产生uORFs导致人类疾病共有14种,反之,由多态性或突变致使uORFs消失的引起的人类疾病有2种,此外还包括其他一些间接的因素如uORFs编码的短肽、翻译起始因子的磷酸化等均可围绕uORFs对下游基因表达产生显著的影响。到目前为止,对于人类多种疾病的变化与uORF之间关系尚无系统性的研究,为此,在前期应用生物信息学的手段对几个现有的公共数据库中人类基因转录本上uORF进行研究,通过数据过滤、筛选、GO功能注释和Kozak序列特征的分析,以及ClinVar、TCGA、COSMIC三个疾病数据库分析的基础上,在多形性胶质母细胞瘤、子宫内膜癌与头颈部鳞状细胞癌病人的突变基因中随机挑选出高度怀疑蛋白表达的改变与uORF密切相关的靶点基因,并进行实验验证。我们希望通过这项研究,让更多的研究者关注人类疾病与uORF的关系,有助于理解疾病的表型与基因型的关系,为研究疾病发生的机制提供新的思路,也为疾病的临床治疗提供新的方向。材料与方法1.在前期生物信息学数据分析的基础上的研究我们利用现有的refGene、Genebank等数据库计算并注释出所有经实验验证的基因的5’UTR的起始和终止坐标并提取其序列,经过一致性校对,筛选出两套数据集中完整性和一致性高的序列条目,然后扫描含有uORF的转录本及其对应的基因名。对遴选出来含有uORF的基因进行GO功能注释与富集,对翻译起始位点(translati