北京基因組所生命與健康大數據中心研究成果與資源建設取得階段性進展
近日,中國科學院北京基因組研究所生命與健康大數據中心團隊題為“Database Resources of the BIG Data Center in 2018”的研究論文在國際學術期刊Nucleic Acids Research在線發表。這是繼去年首次在該期刊以中心為模式發布我國生命組學數據資源建設成果“The BIG Data Center: from deposition to integration to translation”以來的又一階段性重要進展,標志著我國建設綜合型生物信息資源庫進一步獲得國際同行認可。
生命與健康大數據中心面向國家大數據發展戰略,承擔著建成多層次生物組學數據資源系統、建設組學大數據匯交共享平臺并建立多組學生物大數據資源體系的重要任務。生命與健康大數據中心在原有多組學資源庫基礎上,添加建立了四個新庫,包括生物信息工具代碼庫(Biological Tool Codes,BioCode),生物項目數據庫(Biological Project Library,BioProject),生物樣本數據庫(Biological Sample Library,BioSample),內參基因知識庫(Internal Control Genes,ICG)。同時,更新了原有的多個數據庫,包括原始測序數據歸檔庫(Genome Sequence Archive,GSA),基因表達數據庫(Gene Expression Nebulas,GEN),基因組變異數據庫(Genome Variation Map,GVM),表觀基因組數據庫(Methylation Bank,MethBank),生命科學維基知識庫(Science Wikis)。此外,推出了三個特色網絡服務,即跨庫檢索服務BIG Search,統一認證與單點登錄服務BIG SSO,生物數據提交服務Gsub。其中,BIG Search不僅可對大數據中心內部數據庫進行多庫檢索,還實現了多單位的跨庫檢索,包括北京大學(LncRNADisease)、天津大學(DoriC,DEG)、華中科技大學(AnimalTFDB,dbPAF,lncRNASNP,PLMD)的多個重要數據庫。
生命與健康大數據中心章張研究員、趙文明高級工程師、肖景發研究員、鮑一明研究員為本文共同通訊作者。該研究得到中國科學院戰略性先導科技專項、中國科學院國際大科學計劃、國家863計劃、國家973計劃、國家自然科學基金等項目的資助。
生命與健康大數據中心核心數據資源