“領雁金獎”獲得者章張:建立生物大數據中心
2018年7月,炎夏初至,蟬鳴驟起,牛廣藝完成了她在Nucleic Acids Research 雜志的投稿。同年,牛廣藝所在的中國科學院北京基因組研究所共在該雜志發表7篇重要研究成果,在這張優異的成績單中,有4篇是在牛廣藝師從的章張老師帶領下完成的。
章張,曾在美國耶魯大學從事博士后研究、在沙特阿卜杜拉國王科技大學擔任研究科學家,是首位入選國際生物審編學會執行委員會的中國學者,豐富的海外科研經歷讓章張成為他人口中“年輕有為”的代表。2011年,章張通過中科院海外優秀人才引進計劃回到祖國,現為國家基因組科學數據中心副主任、中國科學院大學崗位教授。
回國伊始,剛好趕上國家開始重視生物大數據的階段,在個人興趣和國家需要的雙重動力作用下,章張和生物大數據這一領域結下了不解之緣。“生物大數據的海量激增和人工智能的快速發展,使得生物信息學領域正在發生著翻天覆地的變化”,擁有扎實的計算機學科基礎的章張說道。
如今,圍繞國家基因組科學數據中心和國家生物信息中心的建設工作已步入正軌,這其中,離不開章張及其團隊堅持不懈的努力。“在生物大數據的海洋中乘風破浪”,既是章張回國幾年的日常寫照,也是我國生物信息領域不斷發展的縮影。
趕上國際步伐
在世界上,被國際認可的生物信息中心有三個,分別是美國國家生物技術信息中心NCBI、歐洲生物信息研究所EBI和日本核酸數據庫DDBJ,他們共同掌握著國際上主要的生物數據資源。上世紀90年代,我國的老一輩院士開始呼吁建設國家級的生物數據中心,直至今日,歷經20年,這個愿望終于實現。
“提起生物大數據,也許很多人會感到陌生,它看不見、摸不到。但其實,生物大數據和石油一樣,屬于國家基礎性戰略資源,在生物學、醫學甚至農學等學科都起著非常重要的作用。”章張提到,傳統的生物學是觀察型學科,隨著人類基因組計劃的完成,生命科學和醫學將過渡到數據科學,所以在未來,生物醫學領域的數據也會因此而呈爆炸式增長。“我們的地球上有近75億人,每個人的生理狀況各不相同,使用生物大數據,就能針對每個病人的具體情況給出最精準的治療方案,或者在人們健康的時候,能提前預知身體可能出現的病變,為預防工作提供一個可靠的指導”。比如華為、騰訊等公司已開始使用生物大數據來觀察人們的健康狀態,例如判斷病人是否患了腫瘤,通過基因組觀察腫瘤患者的潛在特征,為疾病預防、診斷、預后等精準治療提供分子依據等。
我國的生物大數據中心與國際相比起步較晚:2015年醞釀,2016年中國科學院北京基因組研究所成立“生命與健康大數據中心”,2019年,國家批準成立“國家基因組科學數據中心”和“國家生物信息中心”,這表明我國對生物大數據等領域的建設越來越重視。
建立生物大數據中心
說到生物大數據中心的成立,章張用了“一窮二白”和“摸索前行”兩個詞來形容。籌建前期,研究所里相關領域的幾個課題組在不同的方向積極開拓,雖然建立了一些數據庫,但還不夠完善,卻為以后的發展積攢了重要的經驗和技術。2016年,才有了“生命與健康大數據中心”的誕生。
既然要做,就要做到最好。在生命與健康大數據中心成立初期,章張及其團隊就將目標鎖定為國際三大數據中心,開始了艱難“創業”。首先是梳理數據、查漏補缺,章張把每個課題組的前期基礎進行了優化整合,從數據的不同層次、類型和角度把數據資源體系建立起來。之后,又采取“請進來、走出去”的方法,積極向國際三大數據中心學習,成立國際科學咨詢委員會,邀請國際知名專家給予寶貴建議和意見,團隊成員多次赴美國NCBI、歐洲EBI等多個機構學習交流經驗,正如章張所說:“我們把口號喊出來了,就得拼盡全力。”
科研之路從來都不會是一帆風順的。在生命科學領域發表文章時,按慣例需要把所有的數據提交到國際三大生物數據中心,但這些數據對于我國的科研工作者來說,是極其寶貴的資源。尤其是生物數據具有“海量”的特點:普通的電腦硬盤是1TB,1TB等于1024GB,一篇論文的數據可能就會有幾十TB甚至上百TB之多。拋開復雜多變的國際形勢不談,一旦遭遇自然災害等意外,就會嚴重影響到我國相關領域的科研進程。
比如在2006年,一場地震造成了太平洋海底光纜故障,導致了我國學者在一段時期內無法訪問國外數據庫的情況出現。“科學無國界,但科學家有祖國”。我國的學者一直希望把這些珍貴的研究成果和數據保留一份在國內,用于祖國建設和民生福祉。為此,在中心籌建伊始,章張團隊就未雨綢繆,與各大期刊及學者溝通合作,把科學數據管理的本土化工作做到了前面,為我國數據安全管理和共享利用提供了有力保障。
是學者,亦是師者
2020年秋天,章張成為國科大“領雁金獎”的獲得者,這既是對他身為一名“學者”,懷抱信念、學識扎實的肯定,也是對他作為一位“師者”,以身作則、仁愛仁心的認同。
談到人才培養,章張娓娓道來:“我認為學生培養最重要的一條就是因材施教、因人而異,因為每個學生的學科背景和興趣方向都不一樣。每當招收新生時,我都會告訴他們,這幾年你們在學業方面最重要的一個人就是我,所以一定要把個人訴求和想法告訴我,充分溝通后,我可以把實現的途徑以及前景勾畫出來,避免你們走太多彎路和錯路。”
章張很愿意花更多時間去陪學生,和他們溝通科研問題、了解他們的學習生活。在章張眼中,判斷一個人熱愛的標準,是看他是否愿意為之付出時間。而用大量精力引導學生,就是章張愛學生最好的證明。
對于團隊建設,章張認為一支隊伍,最重要的就是團結和合作。章老師經常鼓勵學生在完成自己課題的同時,多多參與組內其他課題的研究。“把自己項目做深,是深度;和其他項目合作,是廣度。同時擁有兩個維度的鍛煉,對于學生來講是大有好處的。”章張希望,從自己團隊走出來的學生,在經歷了雙維度訓練后,都能成為個人水平突出、協作能力優秀的全能型人才。
之所以說章張是才兼文武的“神仙”導師,是因為除了學術,章老師還是一位體育健將。工作之余,章張經常通過帶學生踢球、爬山、散步等方式,來緩解大家科研方面的壓力。劉琳是章張的博士研究生,然而,擅長學術研究的她對戶外運動方面興趣全無。“老師經常會帶我們去奧林匹克公園散步,我是一個很宅的人,老師有時候看我太懶了,就會來我們辦公室,‘抓’我們出去鍛煉。”后來,章張在和另一位學生散步時,偶爾討論出了一個新的課題方向,“這個消息讓我們都特別振奮,這下都愿意和老師出去散步鍛煉了,哈哈。”
“人生最巧妙的事情莫過于緣分”,劉琳回憶道,在一次西山秋游中,章張走到一處山坡,突然覺得似曾相識,趕緊掏出手機翻看,“章老師在手機里找到一張照片,是他2012年回國不久,帶學生在這里春游拍下的,于是我們就在原處,按照原來的動作又留念了一張。”七年光陰,歲月流轉,章張已褪去了初回國時青澀的外表,學生也培養了一批又一批,而不變的是對育人和科研的熱愛與執著。
“北京有家燒烤叫柳葉刀,如果能在《柳葉刀》期刊發表一篇文章,就可以在那里免費吃一頓”,章張說道,“有時候學生發了文章,我就會帶著他們去那里聚一聚,邊吃邊‘立志’。”這家飯店會根據發表論文的影響因子給予相應的折扣,雖然現在已經不提倡關注文章的影響因子,但師生間的樂趣在于科研壓力之余的一期一會,和久違小聚時的一談一笑。
人能盡其才則百事興,如今,國家基因組科學數據中心在章張及其團隊的努力下已初具規模,但由于我國在這方面起步較晚,要做的事情還有很多。對于未來,章張期望國家可以對生物信息學的作用給予持續的關注與支持,希望包括數學、計算機、物理、化學、醫學等不同學科背景的人才,可以投身到生物信息學研究領域來。(原標題:章張:才兼文武的“神仙”導師 作者系國科大記者團成員)