質體是負責真核生物(如植物、藻類和原生生物)光合作用的關鍵細胞器,它也被當作遺傳轉化和操作的重要材料。質體的結構和數目不同于包括線粒體在內的其它細胞器,其表型同時受到遺傳學和環境因子的影響。質體基因組產生數量可觀的參與多種生物學過程(如光合作用、呼吸作用和翻譯等)的核心蛋白質。不同物種的質體基因組的基因數目和種類是有差異的,而且,它們還具有不同程度的序列保守性和功能保守性。
我們已經知道存在一些類似操縱子的結構(基因成簇),它們傾向于共同表達,從而提高轉錄和翻譯的效率,最終在進化上由于選擇壓力的作用而不容易被拆開。目前存在的質體或者葉綠體相關的數據庫主要集中在單個基因組的數據注釋方面,而同時考慮多物種間的比較基因組學和進化生物學方面的研究較為缺乏。中國科學院北京基因組研究所于軍研究員和英國倫敦大學學院腫瘤研究所王大鵬博士構建了以質體基因組結構變異和成對基因保守性為主要內容的數據庫Plastid-LCGbase,該研究成果發表于近期出版的Nucleic Acids Research雜志。
該數據庫共收集470個質體(主要是葉綠體)基因組,將物種按照界、門、綱、目、科、屬進行分類整理。顯示基因組水平的宏觀基因分布情況以及不同基因組間DNA和編碼序列的同源程度。展示不同進化尺度和分類下成對基因的保守模式以及周圍基因的插入或刪除、重排和易位等基因變異模式。此外,按照轉錄方向參數和物理距離參數的原則,將成對基因分成了三種類別“頭對頭”、“頭對尾”和“尾對尾”以及三種模式“分離”、“重疊”和“包含”,同時考察成對基因轉錄起始位點間距離的可變性。數據庫還通過連接高度保守的基因對,為每個物種鑒定了潛在的操縱子結構。
該數據庫囊括了來自廣泛代表性物種的數據,實現了比較基因組數據的可視化,將在探索質體或葉綠體基因組保守和變異的動態規律方面為廣大用戶提供一個有力的平臺。
原文鏈接

數據庫頁面