美國愛荷華大學區健輝(Kin Fai Au)博士來基因組所交流訪問
3月9日,美國愛荷華大學大學內科醫學系和生物統計學系的區健輝(Kin Fai Au)博士,應Genomics, Proteomics & Bioinformatics (GPB)編輯部邀請,到基因組所進行學術訪問交流,與基因組所胡松年、雷紅星、陳非、孫英麗、張治華及張兵博士等進行了深入的交流與探討,并在基因組所為相關科研人員做了題為“Hybrid-Seq, Gene Isoform Identification in hESCs, Gene Fusion Identification in Breast Cancer”的學術報告,胡松年博士主持了本次報告會。
區博士從第二代和第三代測序各自的優劣點入手,提出了Hybrid-Seq測序方法的獨特優勢:即利用三代測序產生的長片段低精度序列作為骨架,通過二代測序產生的短片段高精度序列進行校正,從而實現提高序列的精密度和基因組架構準確性的目標。為了解決具體操作中因為同聚體堿基個數判讀錯誤率而引發的同源比對困難,區博士組巧妙地利用了同聚體壓縮的方法(homopolymer compression),將來源相同的長短序列分別進行壓縮,匹配,架構,再還原,從而節約了計算資源,確保了序列精確和架構準確(LSC軟件)。以這種精確作業為基礎,區博士開發的算法有助于鑒別基因組中的基因異構體(IDP軟件)。
以人類胚胎干細胞(human embryonic stem cells)基因組為例,區博士通過降低可變剪切外顯子連接區排列組合的自由度來構建可操作的剪切變體庫,基于測序量,以先驗概率為罰函數對未被發現的剪切變體進行預測。他們將開發的軟件應用在預測人類胚胎干細胞的基因剪切變體工作中,在已知的剪切變體中有很好的捕獲率,且給出的假陽性率比同類軟件算法有非常顯著的改善。這種改善將使接下來的實驗室操作有極大的可操作性,因此具有重大意義。此外,得益于基因組的精確性,他們還發現了23個新基因,將在接下來的實驗中進行驗證。
區博士作報告并與科研人員互動
最后,區博士介紹了他們最近用IDP算法在基因組中融合基因研究的進展,并將之應用于乳腺癌的研究中以發現融合變體并確定融合位點(IDP-fusion軟件)。
會后,區博士回答了來自學生和研究員們的提問,進行了積極地討論。有近八十名學生老師參與了講座,反響熱烈。報告后區博士和多位PI進行座談并參觀我所基因組測序平臺。
為進一步提升期刊國際影響力、促進本所科研人員與國際專家學者進行學術交流, GPB編輯部策劃了“GPB杰出學者論壇”系列學術講座活動。編輯部邀請領域內優秀學者來本所進行學術訪問,為科研人員做學術報告并與PI進行一對一或多對一的當面交流,為日后的科研合作打下良好基礎。GPB是由我所和遺傳學會共同主辦的開放獲取的英文學術期刊。