`
爪哇岛岛主
  • 浏览: 37890 次
  • 性别: Icon_minigender_1
  • 来自: 杭州(也就是天堂)
社区版块
存档分类
最新评论

xml解析技术漫谈

    博客分类:
  • SGML
阅读更多
xml有哪些解析技术?区别是什么?
DOM:
   处理大型文件时其性能下降的非常厉害。这个问题是由DOM的树结构所造成的,这种结构占用的内存较多,而且DOM必须在解析文件之前把整个文档装入内存,适合对XML的随机访问。
下面给出一个DOM解析xml文件的例子。
package parse.impl;

import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;

import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import parse.ParseXml;

import vo.Person;

public class DomXml implements ParseXml{

	public List<Person> getPersons(InputStream inputStream) throws Exception {
		
		List<Person> persons = new ArrayList<Person>();
		Document document = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(inputStream);
		Element element = document.getDocumentElement();
		
	
		/**
		 * 获取person标签
		 */
		NodeList personNodes = element.getElementsByTagName("person");

		/**
		 * 逐个处理person
		 */
		for(int i=0;i<personNodes.getLength();i++){
			Element personElement = (Element)personNodes.item(i);
			Person person = new Person();
			
			//取出id
			person.setIdCard(Integer.parseInt(personElement.getAttribute("idCard")));
			
			//person的子节点
			NodeList childNodes = personElement.getChildNodes();
			
			//逐个处理子节点
			for(int j=0;j<childNodes.getLength();j++){
				System.out.println("节点"+j+":"+childNodes.item(j).getNodeName());
				//判断是否是元素节点
				if(childNodes.item(j).getNodeType()==Node.ELEMENT_NODE){
					
					//判断子节点名称
					if("name".equals(childNodes.item(j).getNodeName())){
						person.setName(childNodes.item(j).getFirstChild().getNodeValue());
					}else if("age".equals(childNodes.item(j).getNodeName())){
						person.setAge(Integer.parseInt(childNodes.item(j).getFirstChild().getNodeValue()));
					}else if("sex".equals(childNodes.item(j).getNodeName())){
						person.setSex(childNodes.item(j).getFirstChild().getNodeValue());
					}
				}
			}
			persons.add(person);
		}
		return persons;
	}
}

该例子的运行结果为:
节点0:#text
节点1:name
节点2:#text
节点3:age
节点4:#text
节点5:sex
节点6:#text
节点0:#text
节点1:name
节点2:#text
节点3:age
节点4:#text
节点5:sex
节点6:#text
idcard:1001,name:周健儿,age:52,sex:女

SAX:
     SAX是事件驱动型的XML解析方式。它顺序读取XML文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理XML文件,适合对XML的顺序访问
同样给出一个例子。
package parse.impl;

import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import parse.ParseXml;
import vo.Person;

public class SaxXml extends DefaultHandler implements ParseXml  {

	List<Person> persons = new ArrayList<Person>();
	protected void init(InputStream inputStream){
		try{
			SAXParserFactory spFactory = SAXParserFactory.newInstance();
			SAXParser parser = spFactory.newSAXParser();
			parser.parse(inputStream, new SaxXml());
		}catch(Exception e){
			e.printStackTrace();
		}
	}
	public List<Person> getPersons(InputStream inputStream) throws Exception {
		
		init(inputStream);
		return persons;
	}

	@Override
	public void endDocument() throws SAXException {
		System.out.println("解析完毕");
	}

	@Override
	public void skippedEntity(String name) throws SAXException {
		System.out.println("这个在哪里"+name);
	}
	
	/**
	 * 开始标记调用
	 */
	@Override
	public void startElement(String uri, String localName, String name,
			Attributes attributes) throws SAXException {
		
		
		for(int i=0;i<attributes.getLength();i++){
			System.out.println("节点属性名称:"+attributes.getQName(i));
			System.out.println("节点属性值:"+attributes.getValue(i));
		}
		
	}
	
	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		
		System.out.println("节点数据:"+new String(ch,start,length));
	}
	/**
	 * 文件打开时调用该方法
	 */
	@Override
	public void startDocument() throws SAXException {
		System.out.println("开始解析xml文档");
	}

	
}

运行结果:
开始解析xml文档

	


STAX:Streaming API for XML (StAX)
      
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics