XML認證教程:XPATH
XPath即爲XML路徑語言,它是一種用來確定XML(標準通用標記語言的子集)文檔中某部分位置的語言。下面小編爲大家整理了關於XPATH的XML認證教程,一起來看看吧:
用XPath精確定位節點元素
在利用XSL進行轉換的過程中,匹配的概念非常重要。在模板聲明語句 xsl:template match = ""和模板應用語句xsl:apply-templates select = "" 中,用引號括起來的部分必須能夠精確地定位節點。具體的定位方法則在XPath中給出。
之所以要在XSL中引入XPath的概念,目的就是爲了在匹配XML文檔結構樹時能夠準確 地找到某一個節點元素。可以把XPath比作文件管理路徑:通過文件管理路徑,可以 按照一定的規則查找到所需要的文件;同樣,依據XPath所制定的規則,也可以很方 便地找到XML結構文檔樹中的任何一個節點,顯然這對XSLT來說是一個最最基本的功能。
XPath數據類型
XPath可分爲四種數據類型:
節點集(node-set)
節點集是通過路徑匹配返回的符合條件的一組節點的集合。其它類型的數據不能 轉換爲節點集。布爾值(boolean)
由函數或布爾表達式返回的條件匹配值,與一般語言中的布爾值相同,有true和 false兩個值。布爾值可以和數值類型、字符串類型相互轉換。字符串(string)
字符串即包含一系列字符的集合,XPath中提供了一系列的字符串函數。字符串可 與數值類型、布爾值類型的數據相互轉換。數值(number)
在XPath中數值爲浮點數,可以是雙精度64位浮點數。另外包括一些數值的特殊描 述,如非數值NaN(Not-a-Number)、正無窮大infinity、負無窮大-infinity、 正負0等等。number的整數值可以通過函數取得,另外,數值也可以和布爾類型、 字符串類型相互轉換。其中後三種數據類型與其它編程語言中相應的數據類型差不多,只是第一種數據類型是XML文檔樹的特有產物。
XPath節點類型
另外,由於XPath包含的是對文檔結構樹的一系列操作,因此搞清楚XPath節點類型 也是很必要的。回憶一下第二章中講到的XML文檔的邏輯結構,一個XML文件可以包 含元素、CDATA、註釋、處理指令等邏輯要素,其中元素還可以包含屬性,並可以利 用屬性來定義命名空間。相應地,在XPath中,將節點劃分爲七種節點類型:
根節點(Root Node)
根節點是一棵樹的.最上層,根節點是唯一的。樹上其它所有元素節點都是它的子節點 或後代節點。對根節點的處理機制與其它節點相同。在XSLT中對樹的匹配總是先從根 節點開始。
元素節點(Element Nodes)
元素節點對應於文檔中的每一個元素,一個元素節點的子節點可以是元素節點、註釋 節點、處理指令節點和文本節點。可以爲元素節點定義一個唯一的標識id。 元素節點都可以有擴展名,它是由兩部分組成的:一部分是命名空間URI,另一部分是 本地的命名。
文本節點(Text Nodes)
文本節點包含了一組字符數據,即CDATA中包含的字符。任何一個文本節點都不會有緊 鄰的兄弟文本節點,而且文本節點沒有擴展名。
屬性節點(Attribute Nodes)
每一個元素節點有一個相關聯的屬性節點集合,元素是每個屬性節點的父節點,但屬 性節點卻不是其父元素的子節點。這就是說,通過查找元素的子節點可以匹配出元素 的屬性節點,但反過來不成立,只是單向的。再有,元素的屬性節點沒有共享性,也 就是說不同的元素節點不共有同一個屬性節點。
對缺省屬性的處理等同於定義了的屬性。如果一個屬性是在DTD聲明的,但聲明爲 #IMPLIED,而該屬性沒有在元素中定義,則該元素的屬性節點集中不包含該屬性。
此外,與屬性相對應的屬性節點都沒有命名空間的聲明。命名空間屬性對應着另一 種類型的節點。
命名空間節點(Namespace Nodes)
每一個元素節點都有一個相關的命名空間節點集。在XML文檔中,命名空間是通過保留 屬性聲明的,因此,在XPath中,該類節點與屬性節點極爲相似,它們與父元素之間的 關係是單向的,並且不具有共享性。
處理指令節點(Processing Instruction Nodes)
處理指令節點對應於XML文檔中的每一條處理指令。它也有擴展名,擴展名的本地命 名指向處理對象,而命名空間部分爲空。
註釋節點(Comment Nodes)
註釋節點對應於文檔中的註釋。
一個XML文檔樹
我們來構造一棵XML文檔樹,作爲後面舉例的依託:
以下將要介紹一些XPath中節點匹配的基本方法。
路徑匹配
路徑匹配與文件路徑的表示相仿,比較好理解。有以下幾個符號:
(1)用“/”指示節點路徑
如“/A/C/D” 表示節點"A"的子節點"C"的子節點"D",即id值爲d2的D節點, “/”表示根節點。
(2)用“//” 表示所有路徑以"//"後指定的子路徑結尾的元素
如“//E” 表示所有E元素,結果是所有三個E元素, 如“//C/E”表示所有父節點爲C的E元素,結果是id值爲e1和e2的兩個E元素 。
(3)用“*” 表示路徑的通配符
如“/A/B/C/*”表示 A元素→B元素→C元素下的所有子元素,即name值爲b的B元素、 id值爲d1的D元素和id值爲e1和e2的兩個E元素
“/*/*/D”表示上面有兩級節點的D元素,匹配結果是id值爲d2的D元素 , 如“//*”表示所有的元素。
位置匹配
對於每一個元素,它的各個子元素是有序的。
如:/A/B/C[1]表示A元素→B元素→C元素的第一個子元素,得到name值爲b的B元素
/A/B/C[last()]表示A元素→B元素→C元素的最後一個子元素,得到id值爲e2的E元素
/A/B/C[position()>1]表示A元素→B元素→C元素之下的位置號大於1的元素,得到id值爲d1的D元素和兩個具有id值的E元素
屬性及屬性值
在XPath中可以利用屬性及屬性值來匹配元素,要注意的是,元素的屬性名前 要有"@"前綴。例如:
//B[@id]表示所有具有屬性id的B元素,結果爲id值爲b1和b2的兩個B元素
//B[@*]表示所有具有屬性的B元素,結果爲兩個具有id屬性的B元素和一個具有name屬性B元素
//B[not(@*)]表示所有不具有屬性的B元素,結果爲A元素→C元素下的B元素
//B[@id="b1"] id值爲b1的B元素,結果爲A元素下的B元素
親屬關係匹配
XML文檔可歸結爲樹型結構,因此任何一個節點都不是孤立的。通常我們把節點之 間的歸屬關係歸結爲一種親屬關係,如父親、孩子、祖先、後代、兄弟等等。在對 元素進行匹配時,同樣可以用到這些概念。例如:
//E/parent::* 表示所有E節點的父節點元素,結果爲id值爲a1的A元素和id值爲c1的C元素
//F/ancestor::* 表示所有F元素的祖先節點元素,結果爲id值爲a1的A元素和id值爲c2的C元素
/A/child::* 表示A的子元素,結果爲id值爲b1、b2的B元素,id值爲c2的C元素,以及沒有任何屬性的E元素
/A/descendant::* 表示A的所有後代元素,結果爲除A元素以外的所有其它元素
//F/self::* 表示所有F的自身元素,結果爲F元素本身
//F/ancestor-or-self::* 表示所有F元素及它的祖先節點元素,結果爲F元素、F元素的父節點C元素和A元素
/A/C/descendant-or-self::* 表示所有A元素→C元素及它們的後代元素,結果爲id值爲c2的C元素、該元素的子元素B、D、F元素
/A/C/following-sibling::* 表示A元素→C元素的緊鄰的後序所有兄弟節點元素,結果爲沒有任何屬性的E元素
/A/C/preceding-sibling::* 表示A元素→C元素的緊鄰的前面所有兄弟節點元素,結果爲id值爲b1和b2的兩個B元素
/A/B/C/following::* 表示A元素→B元素→C元素的後序的所有元素,結果爲id 爲b2的B元素、無屬性的C元素、無屬性的B元素、id爲d2的D元素、無屬性的F元素、無屬性的E元素。
/A/C/preceding::* 表示A元素→C元素的前面的所有元素,結果爲id爲b2的B元素、id爲e2的E元素、id爲e1的E元素、id爲d1的D元素、name爲 b的B元素、id爲c1的C元素、id爲b1的B元素
條件匹配
條件匹配就是利用一些函數的運算結果的布爾值來匹配符合條件的節點。常用於條件 匹配的函數有四大類:節點函數、字符串函數、數值函數、布爾函數。 例如last()、position()等等,這裏我們就不再贅述。
以上這些匹配方法中,用得最多的還要數路徑匹配。在上一章樣式表的例子中, 無論是在語句中,還是在語句 中,都是依靠給出相對於當前路徑的子路 徑來定位節點的。
相關文章
-
XML認證知識點:XML Schema
處暑如何養生?一年一度的處暑時節又將要到來了,天氣終於可以變得涼爽一些了。那麼你知道處暑節氣如何養生嗎?你知道處暑的時候需要注意什麼嗎?今天小編就來爲大家解答您這些疑惑,告訴你處暑五個注意事項!一、多睡一小時 -
XML認證教程:SAX Parser
SAX 是由 XML-DEV 郵件列表的成員開發的,Java 版本由 David Megginson 維護。他們的目的是提供一種更自然的方法來使用 XML, 這種方法不會涉及到使用 DOM 的那種開銷。 什麼是 SAX讀取和操縱 XML 文件的標準方法是 D -
XML認證教程:DOM Parser
讀了《珍珠鳥》這篇課文,我的感受頗深!作者馮驥才通過與小鳥之間的真實親密接觸使的有了靈感,寫出了這一文章。在他的筆下,我們看到了一隻只可愛又調皮的小鳥,它們是那麼的自由,無拘無束。但害怕是它們的天性,可是在這篇文章 -
XML認證知識點:SAX Parser
讀取和操縱 XML(XML培訓 編程語言培訓 ) 文件的標準方法是 DOM(文檔對象模型)。遺憾的是,這種方法需要讀取整個文件並將它存儲到樹結構中,因而效率不高、緩慢,並且會過度使用資源。一種替代方法是使用 Simple API for XM -
ajax 入門基礎之 XMLHttpRequest對象總結
ajax 入門基礎之 XMLHttpRequest對象總結XMLHttpRequest 提供客戶端同http服務器通訊的協議一:創建IE : http_request = new ActiveXObject("TTP");http_request = new ActiveXObject("TTP");非IE: http_request = new -
PHP如何使用DOM和simplexml讀取xml文檔
導語:PHP如何使用DOM和simplexml讀取xml文檔呢?具體實現代碼請閱讀以下內容,更多詳情請關注應屆畢業生考試網。<?xml version="1.0" encoding="utf-8"?><root><book><title>天龍八部</title><author>金庸</author></book -
IBM認證:XML入門XML簡介
ML即爲可擴展的標記語言(eXtensible Markup Language)。XML是一套定義語義標記的 規則,這些標記將文檔分成許多部件並對這些部件加以標識。 什麼是XMLXML是標記語言。理解XML,首先要理解標記。先說說HTML的標記(Mark -
英語閱讀:Dollar Hit by Trump Tax Plan Doubts
喪制之二 ○沐浴(周 大唐) 周制,大喪,肆師大渳(音尾)以鬯築鬻。(音煮。築香草,煮以爲鬯以浴屍。香草,鬱金也。渳謂浴屍。)小宗伯掌大肆以秬鬯渳屍。(大肆,始陳屍也。杜子春雲以秬鬯浴屍。)君沐粱,大夫沐稷,士沐粱。 -
php生成sitemap.xml的實例代碼
時間過得可真快,從來都不等人,我們的工作又邁入新的階段,來爲以後的工作做一份計劃吧。你所接觸過的計劃都是什麼樣子的呢?以下是小編收集整理的學校出納個人工作計劃,歡迎閱讀與收藏。學校出納個人工作計劃1一、指導思想 -
XML認證知識點:DOM Parser
DOM Document 是以層次結構組織起來的節點,或信息片段的集合。這種層次結構允許開發者瀏覽樹來查找特定信息。通常,分析結構需要在完成任何工作之前裝入整個文檔並且裝入層次結構。 基本的應用程序從創建基本的應用