探索資料庫應用(一):美國NIH LINCS(Library of Integrated Network-based Cellular Signature)計劃

要建立一個生物調控網絡,需要許多資料,來確認每個網絡中節點間的關係,好在近五年來開始有許多計劃在收集相關的資料,NIH LINCS(Library of Integraded Network-based Cellular Signature)便是美國NIH旨在建立各種細胞株在不同擾動情況下(藥物、小分子、基因剔除、cas9 system),細胞內在分子層面的整體變化,雖然我們總是把生物體內各種重要代謝或是功能,使用某個pathway來代表這整個過程的keyholder,但實際上每個pathway上的分子很多都有重複或是交集,這種交集的網絡關係,便必須有更好的方式來探索。

於是圍繞者NIH LINCS計畫產生很多的研究成果和數據,可以由以下的地圖來一窺這計畫相關的機構和佈局。screenshot.png

目前這計畫已經到phase II,也就是已經有很多可以使用的資料可以獲取:

screenshot.png

這計畫另外一個重點是開發好用的分析工具來取用這些資料,下面是目前衍生出來的分析工具:
由上而下的排序是工具的熱門使用程度

L1000CDS2
全名是L1000 Characteristic Direction Signature Search ,為Icah School of Medicine at Mount Sinai的Ma’ayan 實驗室所開發,其使用他們新的一套取表現差異的算法Characteristic Direction Approach,依照論文裡跟其他傳統取表現差異方式如t-test, GLM,都有大幅的提升,其方法的特點在於會考慮單一個基因的表現量和其他基因的關係,而非平行的比較後,在使用multiple correction method 來correct p value。

screenshot.png

Drug/Cell-line Browser
這方法其實有點像是使用SOM,也就是除了色塊把表現類似的分類起來,色塊間的距離則表達色塊間的相似度,目前似乎有點問題,無法正常使用,這也是基於Ma’ayan lab開發出的canvas視覺化clustering的方法

screenshot.png

Drug-Pathway Browser

screenshot.png

這主要是把所有跟 kinase pathway相關的藥物或小分子註解在pathway的圖形上,可以直接點選有興趣的candidate,看起可以用什麼藥物來做抑制。

裡面太多小工具了,但有至少1/2都還在搭建或是微調中,但很多有趣的資料呈現方式可以學習

screenshot.png

 

 

 

發表留言