Java SAX解析器
SAX(針對XML的簡單API)是基於事件爲XML文檔的解析器。不像DOM解析器,SAX解析器創建沒有解析樹。 SAX是一個流接口用於XML的,這意味着使用SAX應用接收事件通知有關XML文檔被處理的元素,屬性,在按順序每次開始在文檔的頂部,並與所述閉合結束根元素。
讀取XML文件從上到下,構成一個結構完整的XML文檔的標記
令牌以相同的順序進行處理,它們出現在文檔中
報告應用程序,因爲它們所出現解析器遇到標記的特性
應用程序提供了必須的解析器註冊的「事件」處理程序
作爲標記標識,在處理程序回調方法相關信息調用
什麼時候使用?
應該使用SAX解析器的時候:
可以在XML文檔從上往下處理以線性方式
該文件並不深層次嵌套
處理一個非常大的XML文檔,DOM樹會佔用太多的內存。典型DOM的實現使用10字節的存儲器以表示XML的一個字節
解決的問題涉及的XML文檔的一部分
數據是可用的,只要它是由解析器看出,這樣的SAX可以很好地用於到達流的XML文檔
SAX的缺點
它是在一個只進入處理隨機訪問方式XML文檔
如果需要跟蹤的數據分析器已經看到或更改項目的順序,必須自已編寫代碼和數據存儲
ContentHandler接口
此接口指定SAX解析器用來通知XML文檔,已經看到部件應用程序的回調方法。
void startDocument() - 調用在一個文件的開頭。
void endDocument() - 調用在一個文件的末尾。
void startElement(String uri, String localName, String qName, Attributes atts) - 調用在一個元素的開頭。
void endElement(String uri, String localName,String qName) - 調用在一個元件的末端。
void characters(char[] ch, int start, int length) - 字符數據出現時調用。
void ignorableWhitespace( char[] ch, int start, int length) - 當DTD是當前和忽略空白遇到時調用。
void processingInstruction(String target, String data) - 當處理指令的認可時調用。
void setDocumentLocator(Locator locator)) - 提供可用於識別文檔中的位置的定位器。
void skippedEntity(String name) - 一個尚未解決實體遇到時調用。
void startPrefixMapping(String prefix, String uri) - 當一個新的命名空間的映射定義調用。
void endPrefixMapping(String prefix) - 當一個命名空間定義結束其範圍時調用。
屬性接口
這種接口指定用於處理連接到一個元素的屬性的方法。
int getLength() - 返回屬性的數目。
String getQName(int index)
String getValue(int index)
String getValue(String qname)