首页手记 XML解析器：JAXP、DOM4J、Jsoup、Jso...

XML解析器：JAXP、DOM4J、Jsoup、JsoupXPath使用指南

标签：

Java 源码设计模式

前言

在软件开发中，XML（可扩展标记语言）是一种常用的数据交换格式。为了处理和操作XML数据，我们需要使用XML解析器。本文将介绍几种常用的XML解析器，包括JAXP、DOM4J、Jsoup和JsoupXPath，并提供详细的使用指南。

JAXP（Java API for XML Processing）

JAXP是Java平台提供的用于处理XML的API。它包含了DOM（文档对象模型）、SAX（简单API for XML）和StAX（流API for XML）三种解析方式。

DOM解析

DOM解析将整个XML文档加载到内存中，形成一个树状结构，可以方便地进行节点遍历和修改。以下是使用JAXP进行DOM解析的示例代码：

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;

public class JAXP_DOMExample {
    public static void main(String[] args) throws Exception {
        // 创建DocumentBuilder对象
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();

        // 解析XML文档
        Document document = builder.parse("example.xml");

        // 获取根节点
        Element root = document.getDocumentElement();

        // 遍历子节点
        NodeList nodes = root.getElementsByTagName("book");
        for (int i = 0; i < nodes.getLength(); i++) {
            Element book = (Element) nodes.item(i);
            String title = book.getElementsByTagName("title").item(0).getTextContent();
            System.out.println("Title: " + title);
        }
    }
}

SAX解析

SAX解析是一种基于事件驱动的解析方式，它逐行读取XML文档，不会将整个文档加载到内存中。以下是使用JAXP进行SAX解析的示例代码：

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.helpers.DefaultHandler;

public class JAXP_SAXExample {
    public static void main(String[] args) throws Exception {
        // 创建SAXParser对象
        SAXParserFactory factory = SAXParserFactory.newInstance();
        SAXParser parser = factory.newSAXParser();

        // 解析XML文档
        parser.parse("example.xml", new DefaultHandler() {
            @Override
            public void startElement(String uri, String localName, String qName, Attributes attributes) {
                if (qName.equals("title")) {
                    System.out.println("Title: " + qName);
                }
            }
        });
    }
}

StAX解析

StAX解析是一种基于迭代器的解析方式，可以同时读取和写入XML文档。以下是使用JAXP进行StAX解析的示例代码：

import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamReader;
import java.io.FileInputStream;

public class JAXP_StAXExample {
    public static void main(String[] args) throws Exception {
        // 创建XMLStreamReader对象
        XMLInputFactory factory = XMLInputFactory.newFactory();
        XMLStreamReader reader = factory.createXMLStreamReader(new FileInputStream("example.xml"));

        // 解析XML文档
        while (reader.hasNext()) {
            int eventType = reader.next();
            if (eventType == XMLStreamReader.START_ELEMENT && reader.getLocalName().equals("title")) {
                System.out.println("Title: " + reader.getElementText());
            }
        }

        // 关闭XMLStreamReader
        reader.close();
    }
}

DOM4J

DOM4J是一个开源的Java XML解析器，提供了更简洁、易用的API。以下是使用DOM4J解析XML的示例代码：

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class DOM4JExample {
    public static void main(String[] args) throws DocumentException {
        // 创建SAXReader对象
        SAXReader reader = new SAXReader();

        // 解析XML文档
        Document document = reader.read("example.xml");

        // 获取根节点
        Element root = document.getRootElement();

        // 遍历子节点
        List<Element> books = root.elements("book");
        for (Element book : books) {
            String title = book.elementText("title");
            System.out.println("Title: " + title);
        }
    }
}

Jsoup

Jsoup是一款基于Java的HTML解析器，也可以用于解析XML。它提供了类似jQuery的API，方便地选取和操作XML元素。以下是使用Jsoup解析XML的示例代码：

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupExample {
    public static void main(String[] args) throws Exception {
        // 解析XML文档
        Document document = Jsoup.parse("example.xml", "UTF-8");

        // 选取元素
        Elements books = document.select("book");
        for (Element book : books) {
            String title = book.selectFirst("title").text();
            System.out.println("Title: " + title);
        }
    }
}

JsoupXPath

JsoupXPath是Jsoup的扩展库，用于支持XPath表达式的解析和选择。XPath是一种用于在XML文档中定位和选择节点的语言。以下是使用JsoupXPath解析XML的示例代码：

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.NodeTraversor;
import org.jsoup.select.NodeVisitor;
import us.codecraft.xsoup.XPathEvaluator;
import us.codecraft.xsoup.Xsoup;

public class JsoupXPathExample {
    public static void main(String[] args) throws Exception {
        // 解析XML文档
        Document document = Jsoup.parse("example.xml", "UTF-8");

        // 使用XPath选择器
        XPathEvaluator evaluator = Xsoup.compile("//book/title");
        NodeTraversor.traverse(new NodeVisitor() {
            @Override
            public void head(Element element, int depth) {
                if (element.tagName().equals("title")) {
                    System.out.println("Title: " + element.text());
                }
            }

            @Override
            public void tail(Element element, int depth) {
            }
        }, document);
    }
}

总结

本文介绍了JAXP、DOM4J、Jsoup和JsoupXPath等常用的XML解析器，并提供了详细的使用指南。JAXP提供了DOM、SAX和StAX三种解析方式，适用于不同的场景。DOM4J是一个简洁易用的Java XML解析器，提供了丰富的API。Jsoup是一款HTML解析器，也可以用于解析XML，具有类似jQuery的API。而JsoupXPath是Jsoup的扩展库，支持XPath表达式的解析和选择。

选择合适的XML解析器取决于具体的需求和场景。根据项目的特点和个人偏好，选择最适合的解析器来处理XML数据，将极大地提高开发效率和代码质量。

希望本文对你理解JAXP、DOM4J、Jsoup和JsoupXPath的使用有所帮助。通过掌握这些XML解析器的使用方法，你可以更加轻松地处理和操作XML数据，为软件开发带来便利和效益。

参考链接：

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

乔不知

全栈工程师

手记
篇

粉丝

0

获赞与收藏

0

关注作者，订阅最新文章

阅读免费教程

Java并发工具

23个小节 20309 327

Java 并发原理入门教程

26个小节 41240 593

Java 入门教程

50个小节 360306 3311

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空