北京基因組所(國家生物信息中心)發布腦疾病知識庫BrainBase
近日,由中國科學院北京基因組研究所(國家生物信息中心)國家基因組科學數據中心開發的腦疾病知識庫BrainBase正式上線。該研究成果以“BrainBase: a curated knowledgebase for brain diseases”為題在國際學術期刊Nucleic Acids Research在線發表。
腦是人體的神經系統中樞,也是最復雜的人體器官,不僅控制思想、記憶、語言、運動,也調節許多其它器官的功能。腦神經元、膠質細胞或脊髓病變會引發腦疾病,如阿爾茲海默癥、膠質瘤、帕金森綜合征、抑郁癥等,嚴重威脅人類生命健康。國內外已開展實施多項“腦研究計劃”,如中國“腦科學與類腦研究”、美國“BRAIN Initiative”、歐盟“Human Brain Project”等,旨在加深人類對腦疾病、結構和功能的理解,加速在腦健康、類腦計算及智能技術方面的應用。
為促進腦疾病知識整合、組學數據挖掘與再利用,國家生物信息中心研究團隊開發BrainBase知識庫,致力于提供腦疾病-基因關聯知識及藥物-基因互作信息,鑒定腦“特異”表達基因,挖掘膠質瘤的特征基因并提供多組學數據可視化圖譜,為揭示腦疾病的發生發展機制提供重要的數據資源。基于2,768篇已發表文章的文獻審編和公共數據庫的信息提取,整合了123種腦疾病的7,175條疾病-基因關聯信息,2,118種藥物/化合物與623個基因的16,591條藥物-靶點互作信息,鑒定了在腦組織、腦區域、腦脊液、腦細胞水平上的“特異”表達基因。此外,考慮到膠質瘤具有致死率高、預后差、復發率高等特點,BrainBase整合21套公開發表的膠質瘤多組學數據集,分析挖掘不同組學層面、膠質瘤類型、臨床組別、生存差異的關聯信息,提供多場景多維度的基因分子特征可視化圖譜,鑒定4組具有重要臨床指導意義的特征基因,并通過建立結構化審編模型和受控詞表,對已發表的膠質瘤高質量文章進行了詳細的多組學水平注釋和描述。
BrainBase知識庫提供檢索、瀏覽、可視化等功能,方便用戶通過不同腦疾病、基因進行檢索和瀏覽,以模塊化的結構突出不同研究主題,并以FTP下載形式提供所有相關注釋信息與分析結果的開放共享,為腦疾病研究提供重要數據資源和共享平臺。
北京基因組所(國家生物信息中心)特別研究助理(博士后)劉琳,博士研究生張陽及牛廣藝為本文共同第一作者,馬利娜副研究員與章張研究員為共同通訊作者。該研究得到了中科院戰略性先導科技專項、國家重點研發計劃、中科院青促會等項目資助。
BrainBase知識庫主要內容