2015年1月,中科院北京基因組研究所海量磁帶庫備份系統上線,該系統經前期調研、招標、談判、安裝、調試、驗收等一系列工作后于日前正式投入使用。
該系統的引進將有效緩解所內高性能集群數據存儲不足的問題,滿足研究所迅速增長的大數據存儲需求,確保數據的安全性及長久保存,同時為研究所高性能計算平臺提供了有利的存儲支持。
近年來,隨著組學研究帶動的生物大數據時代的到來,高通量測序技術的迅速發展,組學數據亦呈現了爆炸式增長。在資源相對有限的情況下,一方面新產生的數據需要存儲,而另一方面大量非活躍的數據卻占據了大部分存儲空間。如何解決這一矛盾——構建成本低廉、容量大、安全性高、易擴展的存儲介質將是重要舉措。

高性能計算平臺外觀圖
該套系統同普通存儲相比,降低了80%以上的電能消耗,也大大降低了數據存儲的使用成本。其初期可以備份數據量達到3PB,并可方便擴展到10PB甚至更多。系統內部安裝有1200盤LTO6磁帶(單盤2.5TB),4臺LTO6光纖接口磁帶驅動器,最大數據吞吐量1600MB/秒。

磁帶庫系統外觀圖
該套系統作為一種大規模的離線存儲資源,是研究所現有的高性能計算和在線存儲資源的有力補充。其已無縫接入研究所具有5000余CPU計算核心及近4PB在線存儲能力的高性能計算平臺,用戶無需繁瑣復雜的操作就可以方便的將數據轉移到磁帶庫系統。預計,在2015年,該系統將為研究所高性能計算平臺中的400余用戶提供數據存儲及備份服務。

磁帶庫系統內部圖