使用基因功能分類GO(Gene Ontology)分析(一):簡介

Gene Ontology(GO) project主要是由The Gene Ontology Consortium所負責,從1998年開展自今,其重點就是將基因做系統性地注釋,不再只用gene的序列來描述,是用更豐富多元的方式來描述基因的性質,且由此計畫發展出許多針對特定物種的資料庫,簡單說,Gene Ontology的基因注釋分類,提供一套能系統性分析基因功能的工具。將每個基因的“屬性”用很結構性的方式儲存呈樹狀資料庫,既然是資料庫的形式儲存,其資料庫的schema設計其實是很仔細,有一套很縝密邏輯存在的。
screenshot.png

其主要的功能就是將每個基因提供三大方向的屬性分類:

  1. Cellular Component:此處的字串描述在細胞裡面組成的位置或是區域
  2. Biological Process:此處的字串用來描述特定生物內的現象,像是訊息傳遞、細胞發育等等
  3. Molecular Function:此處在分子層面上的現象,比如某個受體的催化等等

 

這樣一套系統其實是可以用來做很多用途的,其中當我們手上拿到上百個在特定狀況下表現的基因時,下一步其實就是放到這樣的系統裡來看整個生物體內發生了什麼狀態,就會用到GO所建立的一整套資料和邏輯。

GO的特性:

  1. 其十多年來,建立了一整套很完整的描述生物功能性質的字串,這些字串都是“machine readable”的,所以可以很scalable的提取和進行分析
  2. 其對於單一基因提供了多維和多角度(功能間的關係)的注釋
  3. 其設計為跨物種的,因為其重點是放在gene層面(當然有些特定基因只出現在特定物種)
  4. 除了樹狀的字串定應完整的生物內功能外,還有描述“基因和功能間”互動的關係

 

 

發表留言