《基因組蛋白質組與生物信息學報》2010年第1期內容推介
分子進化計算軟件KaKs_Calculator 2.0
在分子進化中,Ka (nonsynonymous substitution rate)和Ks (synonymous substitution rate)作為評估不同進化距離物種的直系同源基因之間或者同一物種內的旁系同源基因之間選擇壓力的基本進化動力學參數,對于理解DNA序列水平的進化分歧和達爾文自然選擇的作用具有重要意義。隨著測序技術水平的提高和海量基因組數據的產出,基因組進化分析對計算方法和軟件也提出了新的要求。
在中國科學院北京基因組研究所基因組科學與信息重點實驗室于軍研究員的指導下,博士生王大鵬、張宇賓等所在小組于近期升級開發了評估分子序列水平選擇壓力的軟件——KaKs_Calculator 2.0。這次升級是在1.0版本的基礎上進行的擴展與完善,整體上采取“工具箱”的策略,分別由核心模塊和擴展模塊整合而成。
核心模塊側重于同源序列的Ka和Ks值的評估。它在原有的7種計數方法、1種極大似然方法和2種基于模型選擇和模型平均的方法的基礎之上,增加了7種gamma系列新方法。這些方法分別在原有的核酸替代模型的基礎上引入了序列不同位點原始突變率的變異參數,并且已被證明在特定情況下會比原有方法具有更加精確的評估值。新版本總共有17種選擇壓力(非同義替代率和同義替代率)的計算方法,可以廣泛應用于不同親緣關系物種間的進化動力學研究;同時,可以通過比較來評估基于不同模型的各種方法在計算進化生物學中的性能和各種進化參數的引進對解決具體生物學問題帶來的不同影響。
擴展模塊著力于解決序列正選擇位點的檢測問題。編碼DNA序列的絕大部分位點由于功能約束而趨于保守,選擇壓力會隨位點發生變化,基于整個基因的Ka/Ks計算對于檢測受到適應性選擇的位點是不夠的。我們采用移動窗口的策略,通過計算窗口范圍內序列承受的選擇壓力來檢測正選擇信號;需要特別指出的是,用戶可以設定窗口大小和位移步長,靈活選擇適合于特定同源基因集合的預設參數。
該軟件由C++,java和R語言撰寫,可以同時讀入存于單個文件的大規模的數據進行批量處理,并可在Windows和Linux兩個平臺上運行。下載網址:https://sourceforge.net/projects/kakscalculator2/.
文章全文發表在《基因組蛋白質組與生物信息學報》2010年第1期,網上全文可在Elsevier出版集團的ScienceDirect數據庫(www.sciencedirect.com/science/journal/16720229)瀏覽下載。
磁珠微衛星富集文庫的構建
微衛星由于分布廣泛,具有豐富的多態性、共顯性等特點而被廣泛應用于分子遺傳學、法醫學、生態學等各個領域,因此對于微衛星位點的識別是各學科研究的迫切需要。在中國科學院北京基因組研究所基因組科學與信息重點實驗室胡松年研究員的指導下,博士生耿佳寧、李克欣等開發了一種利用構建磁珠富集文庫來獲取新物種或者稀有物種的微衛星位點的方法。
本文構建的磁珠富集文庫方法具有高效富集微衛星DNA的作用,我們在傳統的富集方法的基礎上做了一些改進,具體改進和方法的優缺點如下:
首先,用超聲破碎基因組DNA是本方法的一個主要的改進。傳統富集文庫的構建常用酶切的方法得到基因組DNA片段,其片段長度依賴于基因組DNA的G+C含量和酶切位點的分布,因而得到的片段有偏向性,而且在基因組上分布也不均勻。當然,也有一些研究者注意到這個問題,并且提出了用多種內切酶共同切割基因組DNA的方法。此方法可以產生比較理想的片段,得到足夠的側翼序列來設計引物,但是如果用多酶切會產生不是平端的酶切產物,產物需要進行末端補平。而且這個方法可以產生多拷貝的一些片段,克隆后有很大一部分克隆含有相同的插入片段,因此減少了有用的微衛星位點的數量。而本文采用超聲的方法可以克服酶切方法的這些不足,還可以根據實驗需要的DNA片段大小選擇超聲的條件,并且用超聲的方法可以節省時間,對溫度也沒有特定要求,且由于是隨機切割,不會完全損害某一類微衛星。只要控制一定的功率和時間,片段大小就基本確定,不需要進行預實驗。
雜交是本方法改進的另一個步驟。本文的方法用了二次雜交,第二次的雜交溫度比第一次提高了2-3度。采用嚴格的二次雜交,可以去除第一次雜交中的非特異DNA片段,明顯提高了陽性克隆率。在文庫構建過程中,雜交、親和捕捉得到單鏈DNA之后進行了一次PCR, 而且對PCR的循環數也做了嚴格的預實驗,挑選合適的循環數,這樣就避免PCR擴增改變基因組本身的微衛星位點的含量和各種類型微衛星之間的比例關系。這些改進使得我們能夠高效、快速構建出穩定性好的微衛星富集文庫。
通過構建微衛星富集文庫和對微衛星位點多態性驗證,最終篩選出高原鼠兔的13對多態性信息含量較高的微衛星位點。同樣,也得到了中國地鼠16對高度多態的微衛星位點。分析結果表明我們建立的富集文庫流程能找到用于遺傳學、生態學等領域的多態性微衛星標記,并且可以通過多態性分析軟件進行后續的種群遺傳學和生態學分析。
當然我們建立的磁珠富集文庫的方法也有缺點,這個方法容易破碎AT區域,而且在我們構建的幾個文庫中沒有找到GC重復的微衛星位點。造成GC位點不容易得到的原因可能是我們雜交的溫度沒有調整好或者是GC區域存在著二級結構,所以我們的方法有待進一步完善。
文章全文發表在《基因組蛋白質組與生物信息學報》2010年第1期,網上全文可在Elsevier出版集團的ScienceDirect數據庫(www.sciencedirect.com/science/journal/16720229)瀏覽下載。