可擴展標記語言XML是什麼?

XML(extensible markup language)全名可擴展標記語言,是一種在文本文件中組織數據的語言,使用簡單的樹狀結構定義資料,在過去十年中,XML數據格式已經成為大型機構常用的數據傳輸格式,如政府網站、NCBI的Pubmed,  Mesh數據庫等。

XML文檔結構會根據一份文件類型定義(Document Type Definition, DTD)組織其內節點而成,而DTD則可以自行定義,如NCBI裡XML文件的DTD文件,裡頭就會詳述基本的文件結構,所有xml節點則會以其定義的DTD來儲存資料。所以當取得一份xml文件時,可以順便了解其DTD文檔,加速處理資料的速度。

XML的結構簡單,一個XML文件代表一個結構化的訊息樹,如下圖示,為從NCBI取得的xml格式資料:

screenshot.png

一份DTD文件,其從上而下定義其文件的包含節點,但以扁平方式來表達文件結構,從下面由US National Library of Medicine取得關於MEDLINE®/PubMed® DTD

screenshot.png

 

對「可擴展標記語言XML是什麼?」的一則回應

發表留言