每年Nucleic Acids Research期刊的資料庫專刊(database issue)都會整理整年新增加的生醫資料庫和有哪些資料庫有更新,能刊登在Nuclei Acids Research的資料庫都有一點的品質,也是找尋可以利用在自己相關領域的素材。
今年的Database issue總共包含152篇論文,有54個新增的資料庫,另外,98個資料庫有更新。這些資料庫的內容有跟基因體結構、基因表現量、基因調控資訊、蛋白質交互作用等。其中有三個資料庫被特別提出來說明其“breakthrough”的貢獻,分別是denovo-db, Monarch Initiative, Open Targets。
“Breakthrough"的新資料庫
denovo-db
這資料庫主要是收集人類相關的基因變異,總共收集40個研究、23098 trios,共32991個de novo variants,每個variant的資料除了基本的染色體位置、變異種類外,還有在轉錄和轉譯層面的資訊,還有嚴重度分數和頻率,目前驗證階段,還有來自於個人的phenotype資訊。整個資料庫的資料都可以被下載供研究使用。
這計畫(說資料庫的話,把他們的企圖講得太小了)主要是想大規模地將其他物種的資訊希望導入到人類疾病和相關機制的推測上,讓genotype-phenotype間的關係能有更多資訊供參考。
Open Targets
這平台提供藥物標的開發的搜尋和視覺化工具,整合疾病跟潛在藥物標的之關係。
這三個平台都提供API串接資料,可以看出目前生醫界在處理資料的規格慢慢貼近軟體業界的水準
值得注意的資料庫
名稱 | 類別 | 介紹 | 論文 |
---|---|---|---|
GTRD | 轉錄因子調控 | 紀錄轉錄因子間的交互關係 | link |
TcoF-DB | 轉錄因子調控 | 記錄轉錄因子和轉錄因子co-factor的交互關係 | link |
The Gene Ontology | 基因功能註釋 | 基因功能註釋 | link |
PANTHER | 蛋白質功能註釋 | 跨種蛋白質功能註釋 | link |
InterPro | 蛋白質註釋 | 蛋白質功能分析,且由不同的蛋白domain | link |
Protein Ontology | 蛋白質註釋 | 蛋白質功能詮釋 | link |
OntobeeOntobee | link資料庫 | 有各種ontology結構的資料庫資訊 | link |
KEGG | 代謝路徑 | 仲要代謝路徑資料庫 | link |
STRING | 蛋白質交互 | 重要蛋白質交互作用資料庫 | link |
BioGRIDBioGRID | 代謝路徑 | 重要代謝路徑資料庫 | link |
pathDIP | 訊息傳遞路徑 | 將現有的訊息傳遞路徑加入但蛋白質間交互的關係來延昇|link | |
TissueNet | 蛋白質互動 | 蛋白質間的交互關係 | link |
XTalkDBXTalkDB | 訊息傳遞(crosstalk) | 註釋不同訊息路徑間的關係 | link |
Exposome-Explorer | 環境飲食基因體學 | 生物標記跟環境風險因子相關 | link |
Pharos | 藥物蛋白體學 | 特定疾病相關的蛋白質標的 | link |
Bio-TDS | 生醫資料文字探勘 | 用自然語言處理技術支持文本式搜尋 | link |