Java StAX解析器
StAX是一個基於JAVA API用於解析XML文檔,類似SAX解析器的方式。但兩種API之間有兩個區別
StAX是PULL API,其中作爲SAX是PUSH API。這意味着如果StAX解析器,客戶端應用程序需要詢問StAX解析器從XML獲取信息它所需要的,但如果是SAX解析器,客戶端應用程序需要獲取信息時,SAX解析器會通知客戶端應用程序的信息是可用的。
StAX的API可以讀取和寫入XML文檔。使用SAX API,XML可以是隻讀的。
環境設置
爲了使用StAX的解析器,應該準備好stax.jar在應用程序的類路徑中。下載 stax-1.2.0.jar.
以下是StAX API的功能
讀取XML文件從上到下,認識構成一個結構完整的XML文檔的標記
令牌是以相同的順序進行處理,它們出現在文檔中
報告應用程序,因爲解析器遇到標記的特性
應用程序提供了一個「事件」讀取器充當了事件,以獲得所需信息的迭代器和迭代。可另一個讀取器是「光標」充當一個指向XML節點。
由於事件被識別,XML元素可以從事件對象進行檢索,並且可以進一步處理。
什麼情況下使用?
應該使用的StAX解析器的時候:
可以處理在自上而下線性方式的XML文檔。
文件並不深入嵌套。
處理一個非常大的XML文檔的DOM樹會佔用太多的內存。典型的DOM的實現使用10字節的存儲器以表示XML的一個字節。
要解決的問題涉及XML文檔的一部分。
數據是可用的,只要它是由解析器處理,這樣StAX可以很好地用於所收到超過數據流的XML文檔。
SAX的缺點
因爲它是在一個處理的方式,而不是隨機訪問XML文檔。
如果需要跟蹤的數據分析器已經看到或更改項目的順序,必須編寫代碼和數據存儲以自己方式處理。
XMLEventReader類
因爲在解析XML文檔時該類提供可用於迭代事件事件迭代器
StartElement asStartElement() - 用於檢索值和元素的屬性。
EndElement asEndElement() - 調用元件的端部。
Characters asCharacters() - 可用於獲得字符,例如一個CDATA,空白等。
XMLEventWriter類
此接口指定創建事件的方法。
- add(Event event) - 添加包含元素XML事件。
XMLStreamReader Class
因爲在解析XML文檔時該類提供可用於迭代事件事件迭代器
int next() - 用於檢索下一個事件。
boolean hasNext() - 用於檢查其他事件的存在與否
String getText() - 用於獲取一個元素的文本
String getLocalName() - 用於獲取一個元素的名稱
XMLStreamWriter類
此接口指定創建事件的方法
writeStartElement(String localName) - 加入定名稱開始元素。
writeEndElement(String localName) - 添加指定名稱的結束元素。
writeAttribute(String localName, String value) - 編寫屬性到元素。