基因組所“人類基因年齡”研究獲新進展
從單細胞生物到智人大約4000百萬年進化過程中,基因不斷地獲得與丟失,使得基因都具有特定的基因年齡(Gene Age),并在漫長的演化過程中留下與基因年齡相關的印記(Age-Related Signatures; ARS)。因此,探討基因年齡與ARS可幫助我們深入揭示分子進化機制、基因功能形成以及人類基因的演化歷史。近期,北京基因組研究所“院基因組科學與信息重點實驗室”、“生命與健康大數據中心”章張研究員帶領的科研團隊通過劃分基因年齡,追溯人類基因演化歷史,整合分析多組學層次上的ARS,開展ARS與基因年齡的系統研究取得了一系列工作進展。該項研究成果近期在Genome Biology and Evolution雜志在線發表。
在生命與健康大數據中心(BIG Data Center;http://bigd.big.ac.cn)高性能計算平臺的有力支撐下,研究團隊首先在研究技術層面,基于馬爾可夫聚類和系統發生分析的方法,將人類基因追溯到26個年齡集合中,該年齡分類策略極大提升了年齡鑒定中的準確性。在此基礎上,研究團隊整合分析了多組學水平上10種不同的ARS,包括基因長度、GC含量、表達量、甲基化程度、蛋白與蛋白交互網絡(PPIN)等,通過主成分分析方法系統解析,發現GC含量和PPIN是與基因年齡最為相關的兩種演化印記。同時,進一步研究揭示出與多拷貝基因(Duplicates)相比,PPIN在單拷貝基因(Singletons)中與基因年齡的相關性更為顯著。
該研究成果將為進一步探索人類基因形成的分子機制(尤其是De novo基因),挖掘與癌癥相關的基因演化歷史,以及深入探討疾病發生發展的機制機理研究等奠定重要基礎。
此工作獲得了中科院戰略性先導科技專項資助、國家高技術研究和發展計劃(863計劃)等資助。
論文鏈接:http://gbe.oxfordjournals.org/content/early/2016/09/07/gbe.evw216
圖1 基因年齡相關的ARS主成分分析