基因組所開發LncRNAWiki數據庫加入國際RNA數據庫聯盟(RNAcentral)
近期,由基因組所開發的長非編碼RNA研究領域特色數據庫LncRNAWiki被國際RNA數據庫聯盟(RNAcentral)收錄。近些年長非編碼RNA成為國際研究的新熱點,與人類癌癥、神經系統等疾病發生密切相關,在疾病診療方面表現出了潛在的重大應用價值。長非編碼RNA的數量與種類均快速地增長,大量相關研究不斷豐富著我們對長非編碼RNA功能與作用機制的認識。與此同時,長非編碼RNA相關的數據庫也在不斷增長。2014年,基因組所生命與健康大數據中心章張研究員帶領的科研團隊采用Wiki技術開發了基于群體審編(Community Curation)的人類長非編碼RNA知識庫LncRNAWiki,該知識庫作為一個信息豐富的人類長非編碼RNA知識庫受到了國際RNA聯盟(RNAcentral)的關注,相關研究人員也將應邀參加由其舉辦的年度聯盟會議。
LncRNAWiki整合了來自于Gencode、LNCipedia、NONCODE、lncRNAdb的十萬多條人類長非編碼RNA序列及信息,并根據基因組位置對長非編碼RNA進行分類。利用Wiki系統的優勢,建立多人協同注釋的結構與模式,根據參與人員的編輯數量與質量,對參與人員的貢獻進行量化打分,且根據分值大小給予作者身份,以此促進長非編碼RNA研究領域科研人員共同完善LncRNAWiki的相關信息和數據更新。相關成果于2014年11月在國際生物信息學領域期刊《Nucleic Acids Research》在線發表后,該研究團隊繼續重點收集了有文獻報道的人類長非編碼RNA,并進行了人工編輯與注釋。目前LncRNAWiki共收錄719個文獻報道的人類長非編碼RNA,其中290個與癌癥等疾病相關,同時還開發了相應的算法對長非編碼RNA編碼的小蛋白或短肽進行預測,共獲得九千多個潛在的由長非編碼RNA編碼的小蛋白或短肽。
LncRNAWiki的后續工作仍將重點解析已知的人類長非編碼RNA,確保有功能報道的人類長非編碼RNA的及時收集與注釋。基于實驗證據深入研究與解析長非編碼RNA的功能與作用機制,同時對長非編碼RNA的序列特征進行深度挖掘及注釋。隨著該項工作的不斷深入與完善,將對科研人員更加全面的研究和掌握疾病發生發展的機制機理打下堅實基礎。
數據庫鏈接:http://lncrna.big.ac.cn
RNAcentral鏈接:http://rnacentral.org/