基因組所開發完成長非編碼RNA數據庫
長非編碼RNA(Long non-coding RNA, lncRNA)是近年來國際研究的新熱點,與人類癌癥、神經系統等疾病發生密切相關,在疾病診療方面表現出了潛在的重大應用價值。雖然長非編碼RNA表達量相對較低,但由于其在轉錄、基因組印記、翻譯、可變剪切、轉錄后表達調控、蛋白運輸與定位等過程的重要作用而被廣泛研究。人類細胞中轉錄大量長非編碼RNA,由于其具有很強的組織與細胞特異性,該數量很可能將繼續增長,給長非編碼RNA的集成整合與注釋帶來巨大挑戰。
針對長非編碼RNA研究領域遇到的這個問題,中國科學院北京基因組研究所基因組科學與信息重點實驗室章張研究組,與沙特阿卜杜拉國王科技大學(King Abdullah University of Science and Technology;KAUST)Vladimir Bajic教授合作,采用Wiki技術開發了基于群體審編(Community Curation)的LncRNAWiki數據庫,該成果于2014年11月在國際生物信息學領域期刊Nucleic Acids Research在線發表。
LncRNAWiki數據庫整合了目前已有的十萬多條長非編碼RNA,對長非編碼RNA進行了分類,建立了多人協同注釋的結構與模式,根據參與人員的編輯數量與質量,對參與人員的貢獻進行量化打分,且根據分值大小給予作者身份。傳統相關數據庫依賴于專業人員對長非編碼RNA進行注釋(Expert Curation),對于數量如此龐大的長非編碼RNA來說,將耗費大量人力、物力與時間。在大數據時代背景下,LncRNAWiki數據庫旨在匯集整個長非編碼RNA研究領域科研人員的智慧和力量,共同完善LncRNAWiki的相關信息和數據更新,以期構建一部長非編碼RNA的百科全書。基于此,該課題組將進一步圍繞非編碼RNA,開展相關生物信息學分析及與疾病關聯研究,開發數據分析工具與算法。
該項研究得到了中國科學院和國家自然科學基金委的資助。
LncRNAWiki數據庫主頁