g:profiler 是用來處理gene list後續功能分析的網頁工具,由愛沙尼亞的University of Tartu裡Institute of Computer Science, Bioinformatics, Algorithmics and Data Mining Group BIIT所維護的。在最新的更新中,其加入了轉錄因子結合位點的預測、Mendelian disease注釋、蛋白質表現等新的功能。
他最棒的地方是有很好的API支援,且2016改版過一次,這款軟件從2007年開發出來,所以維持的團隊有一定的經驗,此款軟件也有不錯的引用率,本身也有可搭配Cystoscape的操作方式,可以用R、python來調用他們的服務,另外,不想用他們開發的Python和R工具包來調用服務,他們有服務API,所以操作上可以非常個性化。
其網頁版本有六大功能(R package:gProfiler只含三個 ):
1. g:GOSt
提供基本的GO enrichment analysis,可以分析自己上傳的gene list,且可同時做Gene Ontology term, reacton, KEGG等資料庫的檢索,輸出資料格式也支援Cytoscape,分析速度快速。喜歡他輸出的GO term有label上depth,這樣可方便後續一些比較仔細的分析。
2. g:Cocoa
提供同時多組gene list的enrichment analysis,並且輸出成方便比較的圖,非常好用。輸出如下圖:
其右邊把所有相比較的組別當作是column,而把每組中有顯著enrichment的term join在一起。
3. g:Convert
可以用來轉換Gene Id,如microarray 的 probeset也可,且比使用bioconductor中affymetrix出的注釋版本還仔細
4. g:Sorter
可以用來查找在ArrayExpress資料庫中跟特定基因表現相似的其他基因
5. g:Orth
用來查找orthologous gene
6. g:SNPense
從序列ontology來mapping 人類SNP
即使不用網頁介面,在R package下操作幾乎沒有什麼學習成本!
參考閱讀: