reactome資料庫的簡介

screenshot.png

 

Reactome是免費的注釋(curated)人類生物體內分子路徑(pathway)和反應(reaction)資料庫,其最棒的特點是有很棒的使用者介面和API,其本身也有R的package REACTOMEPA 可以導入R做分析。
反應reaction
– 定義所有在分子層面的事件,包括分子間的結合、磷酸化、酵素催化、自發性的分子運輸等。可以是單獨的蛋白質或是化學小分子。
路徑pathway
– 路徑是一系列連結起來的反應reaction,像是免疫系統的訊息傳遞、細胞生命週期調控、自噬作用等
資料庫的注釋方式(curation)
– reactome裡面的注釋專注在品質和重要性,都是由有經驗的生物學家經過同儕獨立審核過才納入的,且都註明出處的文獻。
廣泛的討論一下何謂生物路徑(biological pathway)
– 生物路徑是一系列有順序的分子事件,在事件中可能產生新的分子或是改變細胞的狀態、細胞移動或是賀爾蒙的訊號傳遞。可以大致把生物路徑分為代謝相關(metabolism)、基因表現相關(gene expression)、基因調控相關(gene regulation)、信號傳遞(signal transduction)
Reactome可以用來做什麼?
  • 快速瞭解某一個pathway相關的資訊
  • 基本的pathway enrichment analysis
Reactome不適合用來做什麼?
  • 看蛋白質的交互作用(protein-protein interaction)

 

 

 

基本上,使用reactome分析需要一個大螢幕screenshot.png

Reatome的互動式分析設計蠻不錯的,說明清楚

使用reactome做pathway over representation分析的時候,直接把gene list放進去輸入就可以

screenshot.png

左邊可以發現其支援很多種輸入模式,所以可以直接挑選自己想要的,他也可以支持時間序列的輸入方式

輸出的欄位主要有以下四個重要的指標可以看:
1. Curated found
2. Curated total
3. pValue
4. FDR

然後這些資料都可以用csv檔案的格式下載

 

參考討論串:

BioStar: Best Way To Do Pathway Analysis Of A Set Of Genes?

Question:Comparing Pathways Between Two Different Cancer Cell Lines

使用基因功能分類GO(Gene Ontology)分析(一):簡介

Gene Ontology(GO) project主要是由The Gene Ontology Consortium所負責,從1998年開展自今,其重點就是將基因做系統性地注釋,不再只用gene的序列來描述,是用更豐富多元的方式來描述基因的性質,且由此計畫發展出許多針對特定物種的資料庫,簡單說,Gene Ontology的基因注釋分類,提供一套能系統性分析基因功能的工具。將每個基因的“屬性”用很結構性的方式儲存呈樹狀資料庫,既然是資料庫的形式儲存,其資料庫的schema設計其實是很仔細,有一套很縝密邏輯存在的。
screenshot.png

其主要的功能就是將每個基因提供三大方向的屬性分類:

  1. Cellular Component:此處的字串描述在細胞裡面組成的位置或是區域
  2. Biological Process:此處的字串用來描述特定生物內的現象,像是訊息傳遞、細胞發育等等
  3. Molecular Function:此處在分子層面上的現象,比如某個受體的催化等等

 

這樣一套系統其實是可以用來做很多用途的,其中當我們手上拿到上百個在特定狀況下表現的基因時,下一步其實就是放到這樣的系統裡來看整個生物體內發生了什麼狀態,就會用到GO所建立的一整套資料和邏輯。

GO的特性:

  1. 其十多年來,建立了一整套很完整的描述生物功能性質的字串,這些字串都是“machine readable”的,所以可以很scalable的提取和進行分析
  2. 其對於單一基因提供了多維和多角度(功能間的關係)的注釋
  3. 其設計為跨物種的,因為其重點是放在gene層面(當然有些特定基因只出現在特定物種)
  4. 除了樹狀的字串定應完整的生物內功能外,還有描述“基因和功能間”互動的關係