北京基因組所生命與健康大數據中心研究成果與資源建設取得重要進展
近日,中國科學院北京基因組研究所生命與健康大數據中心團隊題為“The BIG Data Center: from deposition to integration to translation”的研究論文被國際學術期刊《核酸研究》(Nucleic Acids Research)在線發表。該研究成果的發表是國內首次以數據中心為模式,整體發布我國生命組學數據資源建設情況,標志著生命與健康大數據中心建設取得實質性重要進展,也標志著我國建設綜合性基因組數據資源獲得國際同行認可。
生命與健康大數據中心建成面向國家大數據發展戰略的多層次生物組學數據資源系統,包括基于高通量測序的原始組學數據歸檔庫(Genome Sequence Archive,GSA),圍繞國家重要戰略生物資源的基因組組數據庫(Genome Warehouse,GWH),基于測序數據的基因表達數據庫(Gene Expression Nebulas,GEN),基于中國人群以及國家重要物種群體的基因組變異數據庫(Genome Variation Map,GVM),基于全基因組DNA甲基化圖譜的表觀基因組數據庫(Methylation Bank,MethBank)以及基于大眾審編(Community Curation)的生命科學維基知識庫(Science Wikis),初步形成我國生命與健康數據匯交與共享平臺,具備可服務于全球的基因組數據共享網絡。
國際三大數據中心(NCBI、EBI、DDBJ)對全球生物數據長期占據著主導地位,北京基因組研究所生命與健康大數據中心(BIG Data Center),作為基因組所的重要研究單元,承擔相關公共數據庫資源體系的研究與建設,面向我國人口健康和社會可持續發展的重大戰略需求,圍繞國家精準醫學和重要戰略生物資源的組學數據,建立海量生物組學大數據儲存、整合與挖掘分析研究體系,發展組學大數據系統構建、挖掘與分析的新技術、新方法,建設組學大數據匯交、應用與共享平臺。
生命與健康大數據中心章張研究員、趙文明高級工程師以及肖景發研究員為本文共同通訊作者。該研究得到中國科學院戰略性先導科技專項、中國科學院國際大科學計劃、國家863項目、國家973項目、國家自然基金項目等項目基金的資助。
大數據中心建設