在做pathway analysis時,常會在各大資料庫中遊走,往往會希望能把自己關注的路徑資料下載下來仔細把玩,這時候會看到超多種的格式出現,像是在KEGG中儲存的KGML格式、SBML格式、SBGN格式等等,往往會讓大腦混亂,好在開始有計算生物社群的團體開始組織如何產生好的標準來交換生物路徑的資訊,那就是BioPax,一個Pathway資料交換的標準格式。
BioPAX(Biological Pathway Exchange)是一種用來描述生物路徑資料的語法,可以用來描述ㄒ訊息傳遞路徑、代謝路徑、分子和基因交互作用以及調控網絡(signaling pathway, metabolic pathway, molecular and genetic interactions and gene regulation networks).
本質上來說,BioPAX是奠基在RDF/OWL格式來發展的,只是使用符合生物路徑需求的描述語句(這部分可以參考前面寫RDF和OWL這兩種用來描述Linked Data的格式),BioPAX的建立也是在Open Biomedical Ontologies推動下所發起的,這是個在美國國家生物醫學數據模型中心補助下的計畫。
目前BioPAX在2010年公佈了level 3的標準,緊接者正在往level 4邁進。(其實level就是version的意思 XD)
那到底BioPAX長什麼樣子呢?可以看看下面這張來自The BioPAX community standard for pathway data sharing. (2010). Nature Biotechnology的圖!
右邊的語法就是BioPAX用來描述一個路徑的方式,假如之前有理解Linked DATA/RDF/OWL等文件格式的話,應該一看就會理解。
BioPAX基本語彙組成
BioPAX基本的語彙可以看得出是以entity為主體,使用三大類的class來註解(為Linked Data/RDF的模式衍生的)
閱讀參考:
The BioPAX community standard for pathway data sharing. (2010). Nature Biotechnology
對「BioPAX(Biological Pathway Exchange)簡介:Pathway資料的交換標準格式」的一則回應